香蕉和GPT Image之外的第3条路:华人15人团队造出AI生图黑马
华人15人团队Luma AI发布AI生图模型Uni-1.1,以推理生成一体化架构、价格腰斩和广告级落地能力,冲入全球前三,成为OpenAI与Google之外的最优解,重新定义品牌视觉生产的可控性与效率。
入选理由:Uni-1.1将推理与生成融合于单一模型,实现品牌一致性、多参考图约束和按句编辑,解决传统AI生图不可控痛点。
公司
别名:arena
发布性能评测与排行榜的平台。
已跟踪 29 条高相关材料
最近变化
2026-06-04 · MiniMax M3 在 Document Arena 排名第 14,评估维度为文档分析与长文本推理能力。
为什么值得关注
Arena.ai 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。
香蕉和GPT Image之外的第3条路:华人15人团队造出AI生图黑马
量子位 · 9.2 分
华人15人团队Luma AI发布AI生图模型Uni-1.1,以推理生成一体化架构、价格腰斩和广告级落地能力,冲入全球前三,成为OpenAI与Google之外的最优解,重新定义品牌视觉生产的可控性与效率。
🚀🚀Qwen3.7 Preview lands on Arena ! Here come Qwen3.7-Max-Preview & Qwen3.7-Plus-Preview. Ali...
Qwen(@Alibaba_Qwen) · 8.5 分
Qwen3.7-Max-Preview and Qwen3.7-Plus-Preview have been released, with Alibaba now being the #6 lab in Text and #5 in Vision at Arena. The p...
With a +125pt improvement, Reve 2.0 shows major improvements over Reve v1.5 across all sub categorie...
lmarena.ai(@lmarena_ai) · 7.5 分
Reve 2.0 相比 v1.5 在所有子类别提升 +125 分,尤其在文本渲染、卡通/动漫/奇幻、写实与电影风格图像及肖像方面表现最佳,并在图像编辑榜单中位列第 7。
已收录 29 条与 Arena.ai 相关的内容,按评分排序。
华人15人团队Luma AI发布AI生图模型Uni-1.1,以推理生成一体化架构、价格腰斩和广告级落地能力,冲入全球前三,成为OpenAI与Google之外的最优解,重新定义品牌视觉生产的可控性与效率。
入选理由:Uni-1.1将推理与生成融合于单一模型,实现品牌一致性、多参考图约束和按句编辑,解决传统AI生图不可控痛点。
Qwen3.7-Max-Preview 和 Qwen3.7-Plus-Preview 已上线,Alibaba 此前在 Text 领域为 #6,Vision 领域为 #5。
入选理由:Qwen3.7 series models are now available for testing on Arena.
Reve 2.0 相比 v1.5 在所有子类别提升 +125 分,尤其在文本渲染、卡通/动漫/奇幻、写实与电影风格图像及肖像方面表现最佳,并在图像编辑榜单中位列第 7。
入选理由:Reve 2.0 相比 v1.5 在所有子类别提升 +125 分,整体性能显著增强。
Mustafa Suleyman 提及 MAI-Image-2.5 已上线 Arena.ai 并将在 MAI Playground 和 Microsoft Foundry 推出。
入选理由:MAI-Image-2.5 已上线 Arena.ai
MiniMax M3 在文档分析与长文本推理的 Document Arena 中排名第 14,其性价比显著提升该领域的帕累托前沿。
入选理由:MiniMax M3 在 Document Arena 排名第 14,评估维度为文档分析与长文本推理能力。
Google DeepMind发布的Gemini 3.5 Flash在Code Arena前端编码评估中取得突破性成绩,得分1507分,较3 Flash提升70分,并超越3.1 Pro版本,同时输出速度提升2倍以上。
入选理由:Gemini 3.5 Flash在Code Arena: Frontend评估中得分1507分,较Gemini-3 Flash提升70点
文章介绍了Arena.ai平台每周收集数百万用户投票的机制。
入选理由:Arena.ai每周收集数百万用户投票
中美AI差距从278%缩小至2.7%,美国仍保持领先。
入选理由:中美AI差距从278%缩小至2.7%
文章介绍了Arena.ai的AI模型排行榜页面,提供基准测试和比较功能。
入选理由:文章链接指向Arena.ai的AI模型排行榜页面。
Arena.ai平台发布了文本竞技场帕累托前沿详细分析功能,用户可根据实验室、许可证、输入/输出价格和上下文长度进行筛选和排序,但具体内容有限。
入选理由:Arena.ai提供LLM模型比较的帕累托前沿分析功能
Arena.ai 推出文本生成图像模型排行榜,提供模型性能、用户投票和评测细节,帮助开发者快速对比和选型。
入选理由:Arena.ai 发布 Text-to-Image Leaderboard,覆盖多款主流 AI 图像生成模型。
Arena.ai 发布多赛道排行榜,提供模型性能对比数据,但缺少深度分析与实践建议。
入选理由:Arena.ai 提供跨赛道排行榜,覆盖多个模型与任务。
文章指出 Qwen3.7 Max 在标题中的排名应为 #4,以匹配视觉效果。
入选理由:Qwen3.7 Max 的标题排名应调整为 #4。
文章介绍了 Text Arena 的排行榜详情页面,提供 LLM 模型对比信息。
入选理由:Text Arena 提供了 LLM 和聊天 AI 模型的对比数据
腾讯混元发布Hy3(295B参数)开源模型预览版,上线Arena平台开放文本与代码评测,但无技术细节、性能数据或架构说明。
入选理由:Hy3是腾讯混元新发布的295B参数开源大模型
该推文仅为 Arena.ai 对 xAI 新发布的 Grok 4.3 模型的简短推广,无技术细节、评测数据或实质性分析。
入选理由:未提供 Grok 4.3 的任何技术参数或能力说明
xAI 发布 Grok-4.3 模型,宣称在 Arena 多模态评测中排名提升,输入/输出 token 成本分别降低 37.5%/58.3%,但未披露技术细节或基准方法。
入选理由:Grok-4.3 已上线 Arena 平台,支持文本、代码、搜索、视觉四类评测
Arena.ai发布DeepMind Gemini 3.5 Flash的对比视频,但推文本身缺乏技术细节,仅提供视频链接和观看建议。
入选理由:Gemini 3.5 Flash的详细对比需通过YouTube视频获取
该推文仅为 Arena.ai 平台对 Grok 4.3 模型排行榜页面的简短推广,未提供任何技术细节、评测方法或实际性能数据。
入选理由:无实质内容,仅含外部链接跳转
文章仅提供了一个模型评估平台的链接,未包含具体技术细节或分析。
入选理由:文章未提供任何技术深度信息
Arena.ai发布的关于Pareto前沿分析功能的简短视频演示推文,仅包含链接和基本统计数据,缺乏具体的技术细节和深度内容。
入选理由:Arena.ai平台提供了Pareto前沿分析功能
这是一条指向文本到图像生成模型排行榜的社交媒体链接,实际内容为空白或仅包含重定向链接,没有实质性的技术分析或深度信息。
入选理由:该推文仅提供排行榜链接,无具体技术细节
Arena.ai 发布了最新的文本模型排行榜,提供了各种文本和聊天 AI 模型的比较。
入选理由:Arena.ai 提供了详细的文本模型排行榜。
这篇文章主要是一个链接分享,引导用户查看视觉AI排行榜,缺乏深度技术内容。
入选理由:文章未提供具体技术细节或分析。
这是一条推特链接,主要目的是推广 Arena.ai 的搜索评分详情页面,信息量低。
入选理由:Arena.ai 提供了 AI 搜索模型的排行榜。
该推文仅为 Arena.ai 平台上线 Laguna XS.2 与 M.1 两个前端代码模型的简短通告,无技术细节、评测数据或架构说明。
入选理由:未提供 Laguna XS.2/M.1 的模型能力、训练方法或性能指标
文章主要介绍了Arena.ai在X平台上发布的一个链接,该链接指向一个可以按过滤器和类别查看排行榜详情的页面。
入选理由:Arena.ai提供了一个排行榜详情页面
该文章主要是一条推文,邀请读者访问Code Arena网站了解前端Web开发的详细信息。
入选理由:文章指向一个关于前端Web开发的排行榜。
Arena.ai 在 X 上发布了一条关于 Video Arena 领跑者详情的推文。
入选理由:Arena.ai 发布了 Video Arena 领跑者详情。