产品

Code Arena

Q: Code Arena 最近有什么新动态？

traeai 已收录 7 篇与 Code Arena 相关的内容。最新一篇是「MiniMax M3 has landed in the Arena and has moved the Pareto frontier! Their latest model ranks #7 f...」，由 lmarena.ai(@lmarena_ai) 发布。

别名：Arena.ai

用于评估和比较大型语言模型在代码基准上的平台。

已跟踪 7 条高相关材料

TraeAI 观察

如果只读 3 篇

MiniMax M3 has landed in the Arena and has moved the Pareto frontier! Their latest model ranks #7 f...

lmarena.ai(@lmarena_ai) · 8.7 分

MiniMax M3 登场 Code Arena 前端第7，得分1531，与 GLM-5.1 并列领先，价格带 Pareto 前沿达 $0.60/ $2.40 每Mtoken。

Qwen3.7-Max 成为全球第二AI编程模型

AI HOT 精选 · 8.5 分

Qwen3.7-Max 成为全球第二 AI 编程模型，得分 1541，在 Code Arena 上仅落后于 Claude。该模型适用于生产环境，能够处理 35 小时的任务、1000 多次工具调用，并在几小时内完成两周的项目。

We took Claude Opus 4.8 for a test drive in the Code Arena: Frontend. Check out some of the outputs ...

lmarena.ai(@lmarena_ai) · 7.5 分

Claude Opus 4.8 在 Code Arena: Frontend 测试中表现出色，专注于 HTML 和 React 的前端开发任务。

MiniMax M3 登场 Arena，推动价格带帕累托前沿

lmarena.ai(@lmarena_ai)6月4日175 字 (约 1 分钟)

MiniMax M3 登场 Code Arena 前端第7，得分1531，与 GLM-5.1 并列领先，价格带 Pareto 前沿达 $0.60/ $2.40 每Mtoken。

入选理由：Code Arena 前端排名第7，得分1531，与GLM-5.1并列。

精选推文#MiniMax#Code Arena#GLM-5.1#帕累托前沿#开源权重英文

Qwen3.7-Max 成为全球第二AI编程模型

AI HOT 精选5月26日152 字 (约 1 分钟)

入选理由：Qwen3.7-Max 在 Code Arena 上得分为 1541，仅次于 Claude。

精选文章#Qwen3.7-Max#阿里云#Code Arena#AI 编程模型#生产环境中文

We took Claude Opus 4.8 for a test drive in the Code Arena: Frontend. Check out some of the outputs ...

lmarena.ai(@lmarena_ai)5月30日134 字 (约 1 分钟)

Claude Opus 4.8 在 Code Arena: Frontend 测试中表现出色，专注于 HTML 和 React 的前端开发任务。

入选理由：Claude Opus 4.8 在前端开发任务中表现出高效和准确性。

精选推文#Claude Opus#Frontend#Code Arena#AI Models英文

Introducing 7 new leaderboard views for frontend output in Code Arena. Aggregate leaderboards don’...

lmarena.ai(@lmarena_ai)5月9日179 字 (约 1 分钟)

Code Arena引入了7种新的前端输出排行榜视图，以更精确地反映最佳前端编码模型的选择取决于正在构建的内容。

入选理由：Code Arena新增7种前端输出排行榜视图。

精选推文#Code Arena#前端#排行榜中文

Laguna XS.2 & M.1 by @poolsideai are ready in the Code Arena: Front-end. Come bring your toughe...

lmarena.ai(@lmarena_ai)5月2日153 字 (约 1 分钟)

Poolside AI 发布开源 MoE 编程模型 Laguna XS.2（33B/3B），专为智能体式前端开发任务优化，支持单卡运行，Apache 2.0 协议。

入选理由：Laguna XS.2 是 Poolside 自研的 33B 总参、3B 激活的稀疏 MoE 编程模型

精选推文#Poolside AI#MoE#代码生成#开源模型#前端开发中文

MiMo-V2.5 Pro by @XiaomiMiMo is the #11 model (#3 among open) in Code Arena: Frontend WebDev and ha...

lmarena.ai(@lmarena_ai)4月30日167 字 (约 1 分钟)

MiMo-V2.5 Pro 在 Code Arena: Frontend WebDev 中排名第11（开放模型中第3），每 MToken 输入成本为1美元，输出成本为3美元。

入选理由：MiMo-V2.5 Pro 在前端开发领域表现出色

精选推文#前端#代码生成英文

Code Arena: Frontend evaluates models on agentic frontend coding tasks from real users building apps...

Code Arena: Frontend 发布公告

lmarena.ai(@lmarena_ai)5月20日100 字 (约 1 分钟)

LMSYS 推出 Code Arena: Frontend 评估平台，专注于测试 AI 模型在真实用户场景下的代理式前端编码能力（HTML/React），但目前仅发布预告，排行榜和技术细节尚未公开。

入选理由：LMSYS 推出 Code Arena: Frontend，专注评估 AI 模型在真实用户构建应用和网站场景下的代理式前端编码能力

精选推文#LMSYS#AI 评估#前端开发#代理式 AI#Code Arena英文

跨材料问答 · Code Arena

回答基于：Code Arena 相关 7 条材料

Code Arena

TraeAI 观察

如果只读 3 篇

相关材料

MiniMax M3 登场 Arena，推动价格带帕累托前沿

Qwen3.7-Max 成为全球第二AI编程模型

We took Claude Opus 4.8 for a test drive in the Code Arena: Frontend. Check out some of the outputs ...

Introducing 7 new leaderboard views for frontend output in Code Arena. Aggregate leaderboards don’...

Laguna XS.2 &amp; M.1 by @poolsideai are ready in the Code Arena: Front-end. Come bring your toughe...

MiMo-V2.5 Pro by @XiaomiMiMo is the #11 model (#3 among open) in Code Arena: Frontend WebDev and ha...

Code Arena: Frontend 发布公告

跨材料问答 · Code Arena

Laguna XS.2 & M.1 by @poolsideai are ready in the Code Arena: Front-end. Come bring your toughe...