Arena.ai在X上:Code Arena的前端排行榜发生了快速变化

TL;DR · AI 摘要
Claude模型在Code Arena的前端排行榜中占据主导,OpenAI和Gemini排名下滑。
核心要点
- Claude模型占据了前五名,Opus 4.7 Thinking以30分优势领先。
- GPT-5.4和GPT-5.3 Codex已不在前十,GPT-5.5进入第六和第八位。
- Gemini-3.1 Pro跌至第七,Qwen-3.6 Plus新进入第九位。
结构提纲
按章节快速跳转。
Claude模型在Code Arena前端排行榜中表现突出。
Claude模型占据了前五名,显示了其强大的竞争力。
GPT-5.4和GPT-5.3 Codex已不在前十,GPT-5.5进入第六和第八位。
Gemini-3.1 Pro跌至第七,Qwen-3.6 Plus新进入第九位。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- Code Arena 前端排行榜
- Claude
- 占据前五
- OpenAI
- GPT-5.4/5.3 不再前十
- Gemini
- 跌至第七
金句 / Highlights
值得收藏与分享的关键句。
Claude by @AnthropicAI now takes all the top five.
Opus 4.7 Thinking enters at #1, about 30 points ahead of Sonnet 4.6.
Older GPT-5.4 and GPT-5.3 Codex entries from @OpenAI are no longer in the top.
Arena.ai 在 X 上:"Code Arena 的前端排行榜中使用视觉输入的代理编程模型变化迅速。本月前十名有一半是新的,Claude 领衔,而较老的 OpenAI 和 Gemini 模型已不在前十之列。
- 由 @AnthropicAI 开发的 Claude 现在占据了所有顶尖位置 https://t.co/qrI3SaL1cM" / X
URL 来源: https://x.com/arena/status/2052467871117418888
发布时间: 2026年5月8日星期五 18:05:19 GMT
Markdown 内容:
Arena.ai 在 X 上:"Code Arena 的前端排行榜中使用视觉输入的代理编程模型变化迅速。本月前十名有一半是新的,Claude 领衔,而较老的 OpenAI 和 Gemini 模型已不在前十之列。 - 由
开发的 Claude 现在占据了所有顶尖位置
不要错过正在发生的事情

Code Arena 的前端排行榜中使用视觉输入的代理编程模型变化迅速。本月前十名有一半是新的,Claude 领衔,而较老的 OpenAI 和 Gemini 模型已不在前十之列。 - 由
开发的 Claude 现在占据了所有前五名。Opus 4.7 Thinking 进入第一名,比 Sonnet 4.6 高出约 30 分,同时 Opus 4.7 也排在第三名。 - 大多数 Claude 4.6 模型得分有所提高,但由于新 4.7 模型提高了标准而失去了排名。 - 由
开发的较老 GPT-5.4 和 GPT-5.3 Codex 模型已不在前十名,而 GPT-5.5 排在第六和第八名。 - 由
开发的 Gemini 仍留在前十名但排名下降:Gemini-3.1 Pro 落至第七名,Gemini-3 Pro 落至第十名,而 Gemini-3 Flash 掉出前十。 - 由
开发的 Qwen-3.6 Plus 进入第九名,为更新后的前十名增添了另一个新供应商。
·
14
12
192
27
阅读 14 条回复