论文

MCP Atlas

别名：Model Context Performance Atlas

衡量模型在长上下文场景下的综合性能指标。

已跟踪 2 条高相关材料

TraeAI 观察

最近变化

2026-06-01 · MiniMax M3 在 SWE-Bench Pro 基准测试中取得 59.0% 正确率，领先多数开源模型。

为什么值得关注

MCP Atlas 被反复提及时，通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。

AI AgentsGeminiGoogleGoogle I/OLLM

如果只读 3 篇

Read more from @MiniMax_AI:

OpenRouter(@OpenRouterAI) · 8.5 分

MiniMax 推出 M3 开源模型，首次融合编码、代理与长上下文能力，在 SWE-Bench Pro 等基准上达 59%+，支持 1M 上下文窗口，推动开源大模型向多能型前沿迈进。

1/ Today at #GoogleIO, we’re releasing Gemini 3.5, our latest family of models combining frontier in...

Jeff Dean(@JeffDean) · 8.5 分

Google 发布 Gemini 3.5 模型家族，首发 3.5 Flash 专注于复杂智能体工作流，在编码和代理基准测试中超越 3.1 Pro，速度比前沿模型快 4 倍，在 Antigravity 中优化后可达 12 倍。

相关材料

已收录 2 条与 MCP Atlas 相关的内容，按评分排序。

Read more from @MiniMax_AI:

MiniMax 发布 M3 开源模型：首个融合编码、代理与长上下文能力的前沿模型

OpenRouter(@OpenRouterAI)6月1日82 字 (约 1 分钟)

85

MiniMax 推出 M3 开源模型，首次融合编码、代理与长上下文能力，在 SWE-Bench Pro 等基准上达 59%+，支持 1M 上下文窗口，推动开源大模型向多能型前沿迈进。

入选理由：MiniMax M3 在 SWE-Bench Pro 基准测试中取得 59.0% 正确率，领先多数开源模型。

精选推文#开源模型#大语言模型#编码能力#长上下文#MiniMax英文

1/ Today at #GoogleIO, we’re releasing Gemini 3.5, our latest family of models combining frontier in...

Jeff Dean 发布 Gemini 3.5

Jeff Dean(@JeffDean)5月20日268 字 (约 2 分钟)

85

Google 发布 Gemini 3.5 模型家族，首发 3.5 Flash 专注于复杂智能体工作流，在编码和代理基准测试中超越 3.1 Pro，速度比前沿模型快 4 倍，在 Antigravity 中优化后可达 12 倍。

入选理由：Gemini 3.5 Flash 专为执行复杂、长周期的智能体工作流而设计。

精选推文#Google#Gemini#AI Agents#LLM#Google I/O英文

跨材料问答 · MCP Atlas

回答基于：MCP Atlas 相关 2 条材料