Arena.ai 最近有什么新动态？

traeai 已收录 29 篇与 Arena.ai 相关的内容。最新一篇是「香蕉和GPT Image之外的第3条路：华人15人团队造出AI生图黑马」，由量子位发布。

公司

Arena.ai

Q: 什么是 Arena.ai？

发布性能评测与排行榜的平台。

别名：arena

发布性能评测与排行榜的平台。

已跟踪 29 条高相关材料

TraeAI 观察

如果只读 3 篇

香蕉和GPT Image之外的第3条路：华人15人团队造出AI生图黑马

量子位 · 9.2 分

华人15人团队Luma AI发布AI生图模型Uni-1.1，以推理生成一体化架构、价格腰斩和广告级落地能力，冲入全球前三，成为OpenAI与Google之外的最优解，重新定义品牌视觉生产的可控性与效率。

🚀🚀Qwen3.7 Preview lands on Arena ！ Here come Qwen3.7-Max-Preview & Qwen3.7-Plus-Preview. Ali...

Qwen(@Alibaba_Qwen) · 8.5 分

Qwen3.7-Max-Preview and Qwen3.7-Plus-Preview have been released, with Alibaba now being the #6 lab in Text and #5 in Vision at Arena. The p...

With a +125pt improvement, Reve 2.0 shows major improvements over Reve v1.5 across all sub categorie...

lmarena.ai(@lmarena_ai) · 7.5 分

Reve 2.0 相比 v1.5 在所有子类别提升 +125 分，尤其在文本渲染、卡通/动漫/奇幻、写实与电影风格图像及肖像方面表现最佳，并在图像编辑榜单中位列第 7。

香蕉和GPT Image之外的第3条路：华人15人团队造出AI生图黑马

量子位5月6日2963 字 (约 12 分钟)

入选理由：Uni-1.1将推理与生成融合于单一模型，实现品牌一致性、多参考图约束和按句编辑，解决传统AI生图不可控痛点。

精选文章#AI图像生成#Luma AI#Uni-1.1#广告自动化#多模态推理中文

🚀🚀Qwen3.7 Preview lands on Arena ！

Here come Qwen3.7-Max-Preview & Qwen3.7-Plus-Preview. Ali...

中文标题

Qwen(@Alibaba_Qwen)5月18日161 字 (约 1 分钟)

Qwen3.7-Max-Preview 和 Qwen3.7-Plus-Preview 已上线，Alibaba 此前在 Text 领域为 #6，Vision 领域为 #5。

入选理由：Qwen3.7 series models are now available for testing on Arena.

精选推文#AI#Model#Lab中文

With a +125pt improvement, Reve 2.0 shows major improvements over Reve v1.5 across all sub categorie...

Reve 2.0 性能更新：全面超越 v1.5

lmarena.ai(@lmarena_ai)6月4日174 字 (约 1 分钟)

入选理由：Reve 2.0 相比 v1.5 在所有子类别提升 +125 分，整体性能显著增强。

精选推文#Reve 2.0#图像生成#图像编辑#性能评测#AI 榜单英文

Try MAI-Image-2.5 today on https://t.co/Fpw3dJaAH1, also coming to the MAI Playground and Microsoft ...

Mustafa Suleyman 在 Twitter 上发布：尝试 MAI-Image-2.5 并加入 MAI Playground 和 Microsoft Foundry

Mustafa Suleyman(@mustafasuleyman)5月27日82 字 (约 1 分钟)

Mustafa Suleyman 提及 MAI-Image-2.5 已上线 Arena.ai 并将在 MAI Playground 和 Microsoft Foundry 推出。

入选理由：MAI-Image-2.5 已上线 Arena.ai

精选推文#MAI-Image-2.5#Arena.ai#Microsoft Foundry中文

MiniMax M3 also ranks #14 in the Document Arena where models are ranked for their capabilities in do...

MiniMax M3 在文档分析排行榜中排名第 14

lmarena.ai(@lmarena_ai)6月4日89 字 (约 1 分钟)

MiniMax M3 在文档分析与长文本推理的 Document Arena 中排名第 14，其性价比显著提升该领域的帕累托前沿。

入选理由：MiniMax M3 在 Document Arena 排名第 14，评估维度为文档分析与长文本推理能力。

精选推文#MiniMax M3#Document Arena#文档分析#长文本推理#性价比英文

A closer look at Gemini 3.5 Flash by @GoogleDeepMind In the Code Arena: Frontend we see sweeping gai...

深入解析Gemini 3.5 Flash：前端编码能力评估

lmarena.ai(@lmarena_ai)5月20日284 字 (约 2 分钟)

Google DeepMind发布的Gemini 3.5 Flash在Code Arena前端编码评估中取得突破性成绩，得分1507分，较3 Flash提升70分，并超越3.1 Pro版本，同时输出速度提升2倍以上。

入选理由：Gemini 3.5 Flash在Code Arena: Frontend评估中得分1507分，较Gemini-3 Flash提升70点

精选推文#Gemini#Google DeepMind#LLM评估#前端编码#AI模型英文

Watch on YouTube to see all the whiteboard details → https://t.co/VGC1VjxxQE

Arena.ai在X上发布视频链接

lmarena.ai(@lmarena_ai)5月18日97 字 (约 1 分钟)

文章介绍了Arena.ai平台每周收集数百万用户投票的机制。

入选理由：Arena.ai每周收集数百万用户投票

精选推文#Arena.ai#用户投票#Web开发英文

Arena.ai on X: "US vs China update. Stanford's AI Index put the US–China gap at 2.7%. Here's what two years of real-world use from the Text Arena shows.

lmarena.ai(@lmarena_ai)5月15日217 字 (约 1 分钟)

中美AI差距从278%缩小至2.7%，美国仍保持领先。

入选理由：中美AI差距从278%缩小至2.7%

精选推文#AI#中美竞争#技术评估中文

Dig into the Arena leaderboards at: https://t.co/yZiJuG8ica

Arena.ai排行榜介绍

lmarena.ai(@lmarena_ai)5月18日50 字 (约 1 分钟)

文章介绍了Arena.ai的AI模型排行榜页面，提供基准测试和比较功能。

入选理由：文章链接指向Arena.ai的AI模型排行榜页面。

精选推文#AI#模型基准测试#Arena.ai英文

Dive into the details of the Text Arena Pareto frontier. Filter and sort by lab, license, input/outp...

lmarena.ai(@lmarena_ai)5月22日77 字 (约 1 分钟)

Arena.ai平台发布了文本竞技场帕累托前沿详细分析功能，用户可根据实验室、许可证、输入/输出价格和上下文长度进行筛选和排序，但具体内容有限。

入选理由：Arena.ai提供LLM模型比较的帕累托前沿分析功能

精选推文#Arena.ai#LLM#排行榜#帕累托前沿英文

Dive into all the leaderboard details at: https://t.co/7NVNbVi1Po

lmarena.ai(@lmarena_ai)6月4日53 字 (约 1 分钟)

Arena.ai 推出文本生成图像模型排行榜，提供模型性能、用户投票和评测细节，帮助开发者快速对比和选型。

入选理由：Arena.ai 发布 Text-to-Image Leaderboard，覆盖多款主流 AI 图像生成模型。

精选推文#AI#图像生成#排行榜#模型评测#Arena.ai英文

Dive into all the leaderboard details across arenas at: https://t.co/PjWOaDEXWR

lmarena.ai(@lmarena_ai)6月4日59 字 (约 1 分钟)

Arena.ai 发布多赛道排行榜，提供模型性能对比数据，但缺少深度分析与实践建议。

入选理由：Arena.ai 提供跨赛道排行榜，覆盖多个模型与任务。

精选推文#Arena.ai#排行榜#模型评估#AI英文

@Alibaba_Qwen Correction: Qwen3.7 Max (20250517) in the title should be rank #4, matching the visual...

Arena.ai 发布 Qwen3.7 Max 标题更正通知

lmarena.ai(@lmarena_ai)5月27日60 字 (约 1 分钟)

文章指出 Qwen3.7 Max 在标题中的排名应为 #4，以匹配视觉效果。

入选理由：Qwen3.7 Max 的标题排名应调整为 #4。

精选推文#Qwen3.7 Max#Arena.ai#标题更正中文

Dive into the Text Arena leaderboard details at: https://t.co/sn807FDZ65

lmarena.ai(@lmarena_ai)5月15日52 字 (约 1 分钟)

文章介绍了 Text Arena 的排行榜详情页面，提供 LLM 模型对比信息。

入选理由：Text Arena 提供了 LLM 和聊天 AI 模型的对比数据

精选推文#LLM#AI 模型中文

Excited to see Hy3 preview live on @arena. Try it out and let us know what you think!

Hunyuan(@TXhunyuan)5月4日269 字 (约 2 分钟)

腾讯混元发布Hy3（295B参数）开源模型预览版，上线Arena平台开放文本与代码评测，但无技术细节、性能数据或架构说明。

入选理由：Hy3是腾讯混元新发布的295B参数开源大模型

精选推文#大模型#开源#腾讯混元#Arena中文

Come evaluate the latest from @xAI, Grok 4.3 at: https://t.co/yZiJuG8ica

lmarena.ai(@lmarena_ai)5月2日143 字 (约 1 分钟)

该推文仅为 Arena.ai 对 xAI 新发布的 Grok 4.3 模型的简短推广，无技术细节、评测数据或实质性分析。

入选理由：未提供 Grok 4.3 的任何技术参数或能力说明

精选推文#xAI#Grok#LLM#AI Benchmark中文

Grok 4.3 by @xAI is now live in the Arena, landing across multiple leaderboards. At $1.25 / $2.50 pr...

lmarena.ai(@lmarena_ai)5月2日180 字 (约 1 分钟)

xAI 发布 Grok-4.3 模型，宣称在 Arena 多模态评测中排名提升，输入/输出 token 成本分别降低 37.5%/58.3%，但未披露技术细节或基准方法。

入选理由：Grok-4.3 已上线 Arena 平台，支持文本、代码、搜索、视觉四类评测

精选推文#xAI#Grok#大模型#AI评测#Arena中英混合

Watch the full video with more comparisons of @GoogleDeepMind's latest Gemini 3.5 Flash on YouTube: ...

观看DeepMind最新Gemini 3.5 Flash的完整对比视频

lmarena.ai(@lmarena_ai)5月21日62 字 (约 1 分钟)

Arena.ai发布DeepMind Gemini 3.5 Flash的对比视频，但推文本身缺乏技术细节，仅提供视频链接和观看建议。

入选理由：Gemini 3.5 Flash的详细对比需通过YouTube视频获取

精选推文#Gemini#DeepMind#AI模型#模型对比英文

Dive into the leaderboard details for Grok 4.3 and see how it stacks up to real-world use cases that...

lmarena.ai(@lmarena_ai)5月4日164 字 (约 1 分钟)

该推文仅为 Arena.ai 平台对 Grok 4.3 模型排行榜页面的简短推广，未提供任何技术细节、评测方法或实际性能数据。

入选理由：无实质内容，仅含外部链接跳转

精选推文#AI#LLM#benchmark中文

Arena.ai on X: "Dive into the all leaderboard details at: https://t.co/PjWOaDEXWR"

lmarena.ai(@lmarena_ai)5月15日42 字 (约 1 分钟)

文章仅提供了一个模型评估平台的链接，未包含具体技术细节或分析。

入选理由：文章未提供任何技术深度信息

精选推文#AI#模型评估中文

Watch a walkthrough of the Pareto frontier on Arena: https://t.co/YujUYdWWiH

Arena.ai在X上的推文：观看Arena上Pareto前沿的演示

lmarena.ai(@lmarena_ai)5月22日40 字 (约 1 分钟)

Arena.ai发布的关于Pareto前沿分析功能的简短视频演示推文，仅包含链接和基本统计数据，缺乏具体的技术细节和深度内容。

入选理由：Arena.ai平台提供了Pareto前沿分析功能

精选推文#Arena.ai#Pareto前沿#机器学习#数据分析中英混合

Arena.ai on X: "See the Text-to-Image Arena leaderboard details at: https://t.co/G1IeZKsywZ" / X

lmarena.ai(@lmarena_ai)5月22日57 字 (约 1 分钟)

这是一条指向文本到图像生成模型排行榜的社交媒体链接，实际内容为空白或仅包含重定向链接，没有实质性的技术分析或深度信息。

入选理由：该推文仅提供排行榜链接，无具体技术细节

精选推文#AI图像生成#排行榜#社交媒体中文

Check out the full Text Arena leaderboard rankings at: https://t.co/sn807FDZ65

查看完整的文本竞技场排行榜排名：https://t.co/sn807FDZ65

lmarena.ai(@lmarena_ai)5月13日57 字 (约 1 分钟)

Arena.ai 发布了最新的文本模型排行榜，提供了各种文本和聊天 AI 模型的比较。

入选理由：Arena.ai 提供了详细的文本模型排行榜。

精选推文#AI#排行榜英文

Dive deeper into Vision leaderboard rankings at https://t.co/tnnHdihKOp

Arena.ai在X上："深入探索视觉排行榜"

lmarena.ai(@lmarena_ai)5月8日52 字 (约 1 分钟)

这篇文章主要是一个链接分享，引导用户查看视觉AI排行榜，缺乏深度技术内容。

入选理由：文章未提供具体技术细节或分析。

精选推文#视觉AI#排行榜英文

Check out the Search Arena score details at: https://t.co/J8xOD3CowR

Arena.ai 在 X 上："查看搜索竞技场评分详情"

lmarena.ai(@lmarena_ai)5月8日55 字 (约 1 分钟)

这是一条推特链接，主要目的是推广 Arena.ai 的搜索评分详情页面，信息量低。

入选理由：Arena.ai 提供了 AI 搜索模型的排行榜。

精选推文#AI#搜索模型英文

Check out Laguna XS.2 & M.1 in the Code Arena: Front-end. https://t.co/DYnDhxb9y7

lmarena.ai(@lmarena_ai)5月2日149 字 (约 1 分钟)

该推文仅为 Arena.ai 平台上线 Laguna XS.2 与 M.1 两个前端代码模型的简短通告，无技术细节、评测数据或架构说明。

入选理由：未提供 Laguna XS.2/M.1 的模型能力、训练方法或性能指标

精选推文#AI#code-generation#benchmarks中文

Filter and view the leaderboard details by the filters and categories that matter most to you at: ht...

lmarena.ai(@lmarena_ai)4月30日156 字 (约 1 分钟)

文章主要介绍了Arena.ai在X平台上发布的一个链接，该链接指向一个可以按过滤器和类别查看排行榜详情的页面。

入选理由：Arena.ai提供了一个排行榜详情页面

精选推文#AI#排行榜英文

Dig into the Pareto details for Code Arena: Frontend WebDev at https://t.co/QfiNrCehbV

lmarena.ai(@lmarena_ai)4月30日195 字 (约 1 分钟)

该文章主要是一条推文，邀请读者访问Code Arena网站了解前端Web开发的详细信息。

入选理由：文章指向一个关于前端Web开发的排行榜。

精选推文#前端#Web开发英文

Arena.ai 在 X 上发布了一条关于 Video Arena 领跑者详情的推文。

lmarena.ai(@lmarena_ai)5月30日47 字 (约 1 分钟)

Arena.ai 在 X 上发布了一条关于 Video Arena 领跑者详情的推文。

入选理由：Arena.ai 发布了 Video Arena 领跑者详情。

精选推文#Arena.ai#Video Arena#社交媒体中文

跨材料问答 · Arena.ai

回答基于：Arena.ai 相关 29 条材料