T
traeai
登录
返回首页
lmarena.ai(@lmarena_ai)

新开源模型:MiniMax M3 已上线 Arena!

7.5Score
新开源模型:MiniMax M3 已上线 Arena!

TL;DR · AI 摘要

MiniMax M3 是首个开源权重模型,同时支持文本、视觉、文档和代码任务,在 SWE-Bench Pro 等基准测试中表现优异,上下文长度达 1M tokens。

核心要点

  • MiniMax M3 在 SWE-Bench Pro 达到 59.0%,Terminal Bench 2.1 达 66.0%,是当前开源模型中编程能力最强之一。
  • 采用 MiniMax Sparse Attention 技术,支持高达 1M tokens 的上下文长度,显著优于主流开源模型。
  • 该模型已上线 lmarena.ai 平台,用户可提交复杂提示并参与投票,评分即将公布。

结构提纲

按章节快速跳转。

  1. §MiniMax M3 正式上线 Arena

    MiniMax M3 已在 lmarena.ai 平台开放测试,支持文本、视觉、文档与代码四大场景。

  2. 该模型是首个开源权重模型,同时具备编码、代理与长上下文处理能力。

  3. SWE-Bench Pro 达 59.0%,Terminal Bench 2.1 达 66.0%,KernelBench Hard 达 28.8%。

  4. 通过 MiniMax Sparse Attention 技术实现百万级 token 上下文窗口,提升复杂任务处理能力。

  5. 用户可在 Arena 提交挑战性提示并投票,官方将很快公布模型综合评分。

思维导图

用一张图看清主题之间的关系。

查看大纲文本(无障碍 / 无 JS 友好)
  • MiniMax M3 开源模型发布
    • 核心能力
      • 多模态支持(文本/视觉/文档/代码)
      • 开源权重
    • 性能亮点
      • SWE-Bench Pro: 59.0%
      • 1M tokens 上下文
    • 平台与互动
      • 上线 lmarena.ai
      • 用户投票评分机制

金句 / Highlights

值得收藏与分享的关键句。

  • MiniMax M3 是首个开源权重模型,同时支持编码、代理与长上下文三大前沿能力。

    MiniMax 官方推文

    ⬇︎ 下载 PNG𝕏 分享到 X
  • 在 SWE-Bench Pro 达到 59.0%,Terminal Bench 2.1 达 66.0%,显示其强大的编程能力。

    MiniMax 官方推文

    ⬇︎ 下载 PNG𝕏 分享到 X
  • 采用 MiniMax Sparse Attention 技术,上下文长度扩展至 1M tokens,远超多数开源模型。

    MiniMax 官方推文

    ⬇︎ 下载 PNG𝕏 分享到 X
#MiniMax#开源模型#多模态#SWE-Bench
打开原文
图片 1:方形头像

全新开源模型:由 @MiniMax_AI 推出的 MiniMax M3 已上线 Arena!

您可在文本、视觉、文档和代码 Arena 的前端界面中找到它。带上您最棘手的提示词并参与投票,评分即将公布!

图片 2:图像

引用

图片 3:方形头像

MiniMax(官方)

@MiniMax_AI

21 小时前

隆重推出 MiniMax M3:首款融合三大前沿能力的开源权重模型 —— 编程与智能体前沿:SWE-Bench Pro 达 59.0%,Terminal Bench 2.1 达 66.0%,SWE-fficiency 达 34.8%,KernelBench Hard 达 28.8%,MCP Atlas 达 74.2% —— MiniMax 稀疏注意力机制支持上下文扩展至 1M ——

图片 4:图像

AI 可能会生成不准确的信息,请核实重要内容