T
traeai
登录
返回首页
OpenRouter(@OpenRouterAI)

MiniMax 发布 M3 开源模型:首个融合编码、代理与长上下文能力的前沿模型

8.5Score
MiniMax 发布 M3 开源模型:首个融合编码、代理与长上下文能力的前沿模型

TL;DR · AI 摘要

MiniMax 推出 M3 开源模型,首次融合编码、代理与长上下文能力,在 SWE-Bench Pro 等基准上达 59%+,支持 1M 上下文窗口,推动开源大模型向多能型前沿迈进。

核心要点

  • MiniMax M3 在 SWE-Bench Pro 基准测试中取得 59.0% 正确率,领先多数开源模型。
  • 该模型支持 1M 上下文长度,通过稀疏注意力机制实现高效长文本处理。
  • M3 首次实现开源模型在编码、代理任务与效率指标上的综合突破,覆盖 5 项权威基准。

结构提纲

按章节快速跳转。

  1. §产品发布:MiniMax M3 模型介绍

    宣布推出首个融合编码、代理与长上下文能力的开源模型 M3,强调其多任务性能突破。

  2. M3 在 SWE-Bench ProTerminal Bench 2.1 等五项基准中分别达到 59.0%、66.0% 等高分,展示综合能力。

  3. 采用稀疏注意力机制,使模型支持高达 1M 的上下文长度,提升长文档处理效率。

  4. M3 标志开源模型向多能型前沿演进,为开发者提供可部署、高性能的替代方案。

思维导图

用一张图看清主题之间的关系。

查看大纲文本(无障碍 / 无 JS 友好)
  • MiniMax M3 开源模型发布
    • 核心能力
      • 编码能力 (SWE-Bench Pro: 59.0%)
      • 代理能力 (Terminal Bench 2.1: 66.0%)
      • 长上下文支持 (1M tokens)
    • 关键技术
      • 稀疏注意力机制
      • 多任务优化架构
    • 行业意义
      • 开源模型前沿化
      • 开发者可部署方案

金句 / Highlights

值得收藏与分享的关键句。

  • MiniMax M3 在 SWE-Bench Pro 上达到 59.0% 正确率,是当前开源模型中最高表现之一,显著优于主流闭源模型基线。

    第 2 段

    ⬇︎ 下载 PNG𝕏 分享到 X
  • 通过稀疏注意力机制,M3 实现 1M 上下文窗口支持,使复杂长文档推理成为可能,解决传统模型上下文限制问题。

    第 3 段

    ⬇︎ 下载 PNG𝕏 分享到 X
  • M3 同时在代理能力(Terminal Bench 2.1: 66.0%)、效率(SWE-efficiency: 34.8%)和硬核基准(KernelBench Hard: 28.8%)上取得平衡,罕见地覆盖多维度评估。

    第 2 段

    ⬇︎ 下载 PNG𝕏 分享到 X
#开源模型#大语言模型#编码能力#长上下文#MiniMax
打开原文

标题:OpenRouter 在 X 上发布:“阅读来自 @MiniMax_AI 的更多内容” / X

原始链接:https://x.com/OpenRouter/status/2061277171960934603

Markdown 内容:

图片 1:方形头像

OpenRouter

@OpenRouter

阅读来自

@MiniMax_AI 的更多内容:

引用

图片 2:方形头像

MiniMax(官方)

@MiniMax_AI

3 小时前

隆重推出 MiniMax M3:首个融合三项前沿能力的开源权重模型——编程与代理前沿能力:SWE-Bench Pro 得分 59.0%,Terminal Bench 2.1 得分 66.0%,SWE-efficiency 得分 34.8%,KernelBench Hard 得分 28.8%,MCP Atlas 得分 74.2%;MiniMax 稀疏注意力机制将上下文扩展至 1M—

图片 3:图像

2026 年 6 月 1 日凌晨 2:42

2,451 次浏览

AI 可能会生成不准确的信息,请核实重要内容