OpenRouter(@OpenRouterAI)
MiniMax 发布 M3 开源模型:首个融合编码、代理与长上下文能力的前沿模型
8.5Score

TL;DR · AI 摘要
MiniMax 推出 M3 开源模型,首次融合编码、代理与长上下文能力,在 SWE-Bench Pro 等基准上达 59%+,支持 1M 上下文窗口,推动开源大模型向多能型前沿迈进。
核心要点
- MiniMax M3 在 SWE-Bench Pro 基准测试中取得 59.0% 正确率,领先多数开源模型。
- 该模型支持 1M 上下文长度,通过稀疏注意力机制实现高效长文本处理。
- M3 首次实现开源模型在编码、代理任务与效率指标上的综合突破,覆盖 5 项权威基准。
结构提纲
按章节快速跳转。
宣布推出首个融合编码、代理与长上下文能力的开源模型 M3,强调其多任务性能突破。
M3 在 SWE-Bench Pro、Terminal Bench 2.1 等五项基准中分别达到 59.0%、66.0% 等高分,展示综合能力。
采用稀疏注意力机制,使模型支持高达 1M 的上下文长度,提升长文档处理效率。
M3 标志开源模型向多能型前沿演进,为开发者提供可部署、高性能的替代方案。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- MiniMax M3 开源模型发布
- 核心能力
- 编码能力 (SWE-Bench Pro: 59.0%)
- 代理能力 (Terminal Bench 2.1: 66.0%)
- 长上下文支持 (1M tokens)
- 关键技术
- 稀疏注意力机制
- 多任务优化架构
- 行业意义
- 开源模型前沿化
- 开发者可部署方案
金句 / Highlights
值得收藏与分享的关键句。
MiniMax M3 在 SWE-Bench Pro 上达到 59.0% 正确率,是当前开源模型中最高表现之一,显著优于主流闭源模型基线。
通过稀疏注意力机制,M3 实现 1M 上下文窗口支持,使复杂长文档推理成为可能,解决传统模型上下文限制问题。
M3 同时在代理能力(Terminal Bench 2.1: 66.0%)、效率(SWE-efficiency: 34.8%)和硬核基准(KernelBench Hard: 28.8%)上取得平衡,罕见地覆盖多维度评估。
#开源模型#大语言模型#编码能力#长上下文#MiniMax
打开原文标题:OpenRouter 在 X 上发布:“阅读来自 @MiniMax_AI 的更多内容” / X
原始链接:https://x.com/OpenRouter/status/2061277171960934603
Markdown 内容:

阅读来自
@MiniMax_AI 的更多内容:
引用

MiniMax(官方)
@MiniMax_AI
3 小时前
隆重推出 MiniMax M3:首个融合三项前沿能力的开源权重模型——编程与代理前沿能力:SWE-Bench Pro 得分 59.0%,Terminal Bench 2.1 得分 66.0%,SWE-efficiency 得分 34.8%,KernelBench Hard 得分 28.8%,MCP Atlas 得分 74.2%;MiniMax 稀疏注意力机制将上下文扩展至 1M—