MiniMax 发布 M3 开源模型:首个融合编码、代理与长上下文能力的前沿模型
MiniMax 推出 M3 开源模型,首次融合编码、代理与长上下文能力,在 SWE-Bench Pro 等基准上达 59%+,支持 1M 上下文窗口,推动开源大模型向多能型前沿迈进。
入选理由:MiniMax M3 在 SWE-Bench Pro 基准测试中取得 59.0% 正确率,领先多数开源模型。
论文
别名:Model Context Performance Atlas
衡量模型在长上下文场景下的综合性能指标。
已跟踪 2 条高相关材料
最近变化
2026-06-01 · MiniMax M3 在 SWE-Bench Pro 基准测试中取得 59.0% 正确率,领先多数开源模型。
为什么值得关注
MCP Atlas 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。
Read more from @MiniMax_AI:
OpenRouter(@OpenRouterAI) · 8.5 分
MiniMax 推出 M3 开源模型,首次融合编码、代理与长上下文能力,在 SWE-Bench Pro 等基准上达 59%+,支持 1M 上下文窗口,推动开源大模型向多能型前沿迈进。
1/ Today at #GoogleIO, we’re releasing Gemini 3.5, our latest family of models combining frontier in...
Jeff Dean(@JeffDean) · 8.5 分
Google 发布 Gemini 3.5 模型家族,首发 3.5 Flash 专注于复杂智能体工作流,在编码和代理基准测试中超越 3.1 Pro,速度比前沿模型快 4 倍,在 Antigravity 中优化后可达 12 倍。
已收录 2 条与 MCP Atlas 相关的内容,按评分排序。
MiniMax 推出 M3 开源模型,首次融合编码、代理与长上下文能力,在 SWE-Bench Pro 等基准上达 59%+,支持 1M 上下文窗口,推动开源大模型向多能型前沿迈进。
入选理由:MiniMax M3 在 SWE-Bench Pro 基准测试中取得 59.0% 正确率,领先多数开源模型。
Google 发布 Gemini 3.5 模型家族,首发 3.5 Flash 专注于复杂智能体工作流,在编码和代理基准测试中超越 3.1 Pro,速度比前沿模型快 4 倍,在 Antigravity 中优化后可达 12 倍。
入选理由:Gemini 3.5 Flash 专为执行复杂、长周期的智能体工作流而设计。