lmarena.ai(@lmarena_ai)
新开源模型:MiniMax M3 已上线 Arena!
7.5Score

TL;DR · AI 摘要
MiniMax M3 是首个开源权重模型,同时支持文本、视觉、文档和代码任务,在 SWE-Bench Pro 等基准测试中表现优异,上下文长度达 1M tokens。
核心要点
- MiniMax M3 在 SWE-Bench Pro 达到 59.0%,Terminal Bench 2.1 达 66.0%,是当前开源模型中编程能力最强之一。
- 采用 MiniMax Sparse Attention 技术,支持高达 1M tokens 的上下文长度,显著优于主流开源模型。
- 该模型已上线 lmarena.ai 平台,用户可提交复杂提示并参与投票,评分即将公布。
结构提纲
按章节快速跳转。
MiniMax M3 已在 lmarena.ai 平台开放测试,支持文本、视觉、文档与代码四大场景。
该模型是首个开源权重模型,同时具备编码、代理与长上下文处理能力。
在 SWE-Bench Pro 达 59.0%,Terminal Bench 2.1 达 66.0%,KernelBench Hard 达 28.8%。
通过 MiniMax Sparse Attention 技术实现百万级 token 上下文窗口,提升复杂任务处理能力。
用户可在 Arena 提交挑战性提示并投票,官方将很快公布模型综合评分。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- MiniMax M3 开源模型发布
- 核心能力
- 多模态支持(文本/视觉/文档/代码)
- 开源权重
- 性能亮点
- SWE-Bench Pro: 59.0%
- 1M tokens 上下文
- 平台与互动
- 上线 lmarena.ai
- 用户投票评分机制
金句 / Highlights
值得收藏与分享的关键句。
MiniMax M3 是首个开源权重模型,同时支持编码、代理与长上下文三大前沿能力。
在 SWE-Bench Pro 达到 59.0%,Terminal Bench 2.1 达 66.0%,显示其强大的编程能力。
采用 MiniMax Sparse Attention 技术,上下文长度扩展至 1M tokens,远超多数开源模型。
#MiniMax#开源模型#多模态#SWE-Bench
打开原文
全新开源模型:由 @MiniMax_AI 推出的 MiniMax M3 已上线 Arena!
您可在文本、视觉、文档和代码 Arena 的前端界面中找到它。带上您最棘手的提示词并参与投票,评分即将公布!
引用

MiniMax(官方)
@MiniMax_AI
21 小时前
隆重推出 MiniMax M3:首款融合三大前沿能力的开源权重模型 —— 编程与智能体前沿:SWE-Bench Pro 达 59.0%,Terminal Bench 2.1 达 66.0%,SWE-fficiency 达 34.8%,KernelBench Hard 达 28.8%,MCP Atlas 达 74.2% —— MiniMax 稀疏注意力机制支持上下文扩展至 1M ——