T
traeai
登录
返回首页
量子位

世界模型榜首易主!跨维智能登顶WorldArena

8.8Score
世界模型榜首易主!跨维智能登顶WorldArena

TL;DR · AI 摘要

跨维智能在World Arena Track 2登顶全球第一,显著领先第二名,验证其具身世界模型在数据生成、策略训练与任务落地的全链路硬实力。

核心要点

  • 跨维智能DSCFuncWorld在World Arena Track 2以高任务成功率登顶,领先第二名约25%分差。
  • Track 2考核数据可训练、可迁移、可执行,以机器人实际作业成功率为核心评判标准。
  • 依托因果隐空间建模与EVA逆动力学奖励,模型生成数据高度贴合物理与机器人运动逻辑,显著提升策略训练与虚实迁移效果。

结构提纲

按章节快速跳转。

  1. 跨维智能在World Arena Track 2登顶全球第一,显著领先第二名,体现全链路落地硬实力。

  2. 由权威专家打造,含16项指标与3大任务,聚焦感知精度、物理理解与动作预测。

  3. 不比拼画面逼真,以机器人任务成功率衡量数据生成、策略训练与落地能力。

  4. 自研DexWorldModel与因果隐空间建模,强化纹理、物体关联与物理规则表达。

  5. ·EVA与可执行性突破

    通过逆动力学奖励对齐视频生成与机器人可执行动作,解决“视觉逼真但无法落地”问题。

  6. 依托EmbodiChain构建完整数据闭环,产出物理可信、场景多元的高质量训练数据。

思维导图

用一张图看清主题之间的关系。

查看大纲文本(无障碍 / 无 JS 友好)
  • 跨维智能登顶World Arena Track 2
    • 榜单与赛道概览
      • 权威评测WorldArena框架
      • Track 2核心指标与评判标准
    • 技术与方法论
      • DexWorldModel与因果隐空间建模
      • EVA逆动力学奖励与可执行性
    • 数据与工程能力
      • EmbodiChain数据基建与闭环
      • 高质量训练数据产出与场景泛化

金句 / Highlights

值得收藏与分享的关键句。

  • 跨维智能在World Arena Track 2登顶,领先第二名约25%分差,以机器人任务成功率为核心指标验证全链路落地能力。

    正文第二段

    ⬇︎ 下载 PNG𝕏 分享到 X
  • Track 2赛道要求模型生成数据具备可训练、可迁移、可执行,直接以机器人实际作业任务成功率作为评判标准。

    正文第三段

    ⬇︎ 下载 PNG𝕏 分享到 X
  • EVA框架通过逆动力学奖励对齐视频生成与机器人可执行动作,显著提升模型生成内容的可操作性与策略训练适配度。

    正文第五段

    ⬇︎ 下载 PNG𝕏 分享到 X
  • 依托DexWorldModel的因果隐空间建模,模型仅需轻量化改造即可快速生成高质量推演视频,强化物理规则与物体关联表达。

    正文第六段

    ⬇︎ 下载 PNG𝕏 分享到 X
#World Arena#具身世界模型#跨维智能#Data Engine#DexWorldModel
打开原文

< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

2026-06-03 17:54:18 来源:量子位

近日,全球具身世界模型权威评测基准 WorldArena 公布最新榜单。在 5 月 25 日截止的最终榜单中,跨维智能登顶 Track 2 赛道全球第一。

可以说是,在英伟达、谷歌等全球科技巨头深度布局、重兵把守的世界模型核心腹地,跨维智能实现了强势突围。

本次登顶不仅与榜单第二名拉开显著比分差距,更显著领先 WoW、BLM 等一众国际模型,大幅刷新该赛道全球最优成绩。

这再一次证明了跨维智能的底层技术实力已稳居全球具身世界模型第一梯队。

Image 1

顶流同台竞技:实用能力领跑全球榜单

当前,世界模型已是英伟达、谷歌、OpenAI等全球AI巨头的核心布局赛道。伴随赛道竞争愈发激烈,一套科学权威的评测体系,成为甄别模型真实能力、引领产业发展的关键。

由全球顶尖高校及科研机构的权威专家共同打造,WorldArena 是目前世界模型赛道最权威的榜单,拥有行业最严苛的评测基准。该评测构建了包含16项细分核心指标和3大真实应用任务的立体化评估体系,全方位严苛考察具身世界模型的感知精度、物理规律理解、三维空间认知以及动作预测与实际落地能力。依托严苛、全面、贴合产业落地的评测标准,WorldArena汇聚全球顶尖科研团队与头部企业模型同台比拼。

评测设立两大核心赛道,能力定位截然不同:Track 1 侧重视觉画面、动态效果、物理一致性等感知表现,偏向可视化技术展示;而本次跨维智能登顶的 Track 2(Data Engine),是实战门槛、技术含金量双高的核心赛道,也是真正衡量模型产业价值的硬核标尺

Track 2(Data Engine)赛道不比拼画面是否逼真,核心考核世界模型作为数据合成引擎、策略评估工具与行动规划载体的全链路落地能力。参赛模型需要依托初始场景观测与文本指令,自主模拟完整机器人交互流程、生成高质量训练数据,最终以机器人实际作业任务成功率作为核心评判标准,检验世界模型数据生成、策略训练、任务落地的全链路硬实力

此次世界模型DSCFuncWorld成功登顶,印证了跨维智能拥有行业顶尖的环境推演与物理认知能力,更凸显出其突出的工程落地优势。模型可将虚拟推演结果高效转化为可用的机器人训练资产,充分验证了跨维智能在具身数据生成、仿真训练闭环、策略赋能、虚实迁移等全链路技术实力。

底层技术闭环铸就长期竞争力,赋能具身智能规模化发展

值得关注的是,跨维智能本次登顶并非单点、偶然的技术突破,而是长期深耕具身智能底层技术、坚持数据与模型双轮驱动的必然结果。

本次冲榜的DSCFuncWorld,属于跨维Dex系列模型,由跨维智能自研核心底座DexWorldModel (https://dexforce.com/technical-report/#/DexWorldModel) 简单适配而来。

Image 2

该原生模型主打因果隐空间建模,依托DINO语义特征空间精准建模未来世界状态,重点强化环境纹理、物体关联、物理规则的鲁棒表达,仅需轻量化改造即可快速生成高质量推演视频,极致发挥数据引擎与策略评估的核心价值。

Track 2赛道的核心竞争力,在于模型生成数据的可训练、可迁移、可执行,这也是长期制约通用具身智能产业化的核心瓶颈。不同于常规模型只追求视觉观感真实,跨维智能始终聚焦数据落地有效性:一方面,模型生成的推演过程、场景轨迹与真实机器人任务高度契合,保障训练数据的适配性;另一方面,生成内容严格遵循物理规则与机器人运动逻辑,具备极强的可操作性,能够有效支撑策略模型迭代优化。

此前,团队推出的EVA技术框架(EVA: Aligning Video World Models with Executable Robot Actions via Inverse Dynamics Rewards;https://eva-project-page.github.io/) ,通过逆动力学奖励机制对齐视频生成与机器人可执行动作,有效解决了行业普遍存在的“视觉逼真但无法落地”的可执行性缺口,让模型生成的推演轨迹更贴合真实机器人作业逻辑。

Image 3

同时,依托自研具身数据基建EmbodiChain (https://github.com/DexForce/EmbodiChain),跨维智能构建了覆盖资产生成、场景布局、可达轨迹采样、失败案例恢复、在线数据回流的完整数据体系,持续产出物理可信、场景多元、任务覆盖全面的高质量训练数据,大幅提升了合成数据对机器人策略训练的赋能效果与场景泛化能力。

Image 4
Image 5

对跨维智能而言,此次DSCFuncWorld登顶的意义,远不止一次榜单突破与技术超越。其自研DexWorldModel世界模型体系,真正的价值在于跳出行业概念内卷,直面具身智能落地过程中最棘手的系统性难题,脚踏实地补齐世界模型通往真实物理世界的关键短板。这也是跨维智能一贯的态度,不和概念赛跑,和真实世界赛跑。

-此文系量子位授权转载-

_版权所有,未经授权不得以任何形式转载及使用,违者必究。_

AI 可能会生成不准确的信息,请核实重要内容