T
traeai
登录

产品

Code Arena

别名:Arena.ai

用于评估和比较大型语言模型在代码基准上的平台。

已跟踪 7 条高相关材料

TraeAI 观察

相关材料

已收录 7 条与 Code Arena 相关的内容,按评分排序。

MiniMax M3 has landed in the Arena and has moved the Pareto frontier!

Their latest model ranks #7 f...

MiniMax M3 登场 Arena,推动价格带帕累托前沿

lmarena.ai(@lmarena_ai)175 字 (约 1 分钟)
87

MiniMax M3 登场 Code Arena 前端第7,得分1531,与 GLM-5.1 并列领先,价格带 Pareto 前沿达 $0.60/ $2.40 每Mtoken。

入选理由:Code Arena 前端排名第7,得分1531,与GLM-5.1并列。

精选推文#MiniMax#Code Arena#GLM-5.1#帕累托前沿#开源权重英文
Qwen3.7-Max 成为全球第二AI编程模型

Qwen3.7-Max 成为全球第二AI编程模型

AI HOT 精选152 字 (约 1 分钟)
85

Qwen3.7-Max 成为全球第二 AI 编程模型,得分 1541,在 Code Arena 上仅落后于 Claude。该模型适用于生产环境,能够处理 35 小时的任务、1000 多次工具调用,并在几小时内完成两周的项目。

入选理由:Qwen3.7-Max 在 Code Arena 上得分为 1541,仅次于 Claude。

精选文章#Qwen3.7-Max#阿里云#Code Arena#AI 编程模型#生产环境中文
Laguna XS.2 & M.1 by @poolsideai are ready in the Code Arena: Front-end.

Come bring your toughe...

Poolside AI 发布开源 MoE 编程模型 Laguna XS.2(33B/3B),专为智能体式前端开发任务优化,支持单卡运行,Apache 2.0 协议。

入选理由:Laguna XS.2 是 Poolside 自研的 33B 总参、3B 激活的稀疏 MoE 编程模型

精选推文#Poolside AI#MoE#代码生成#开源模型#前端开发中文
Code Arena: Frontend evaluates models on agentic frontend coding tasks from real users building apps...

Code Arena: Frontend 发布公告

lmarena.ai(@lmarena_ai)100 字 (约 1 分钟)
45

LMSYS 推出 Code Arena: Frontend 评估平台,专注于测试 AI 模型在真实用户场景下的代理式前端编码能力(HTML/React),但目前仅发布预告,排行榜和技术细节尚未公开。

入选理由:LMSYS 推出 Code Arena: Frontend,专注评估 AI 模型在真实用户构建应用和网站场景下的代理式前端编码能力

精选推文#LMSYS#AI 评估#前端开发#代理式 AI#Code Arena英文

跨材料问答 · Code Arena

回答基于:Code Arena 相关 7 条材料
    0 / 500

    AI 可能会生成不准确的信息,请核实重要内容