T
traeai
登录

产品

Marble

别名:Multi-Aspect Reward Balance for Diffusion RL

World Labs自家产品,用于生成可探索3D环境。

已跟踪 2 条高相关材料

TraeAI 观察

相关材料

已收录 2 条与 Marble 相关的内容,按评分排序。

刚刚,李飞飞亲自下场定义世界模型

刚刚,李飞飞亲自下场定义世界模型

量子位2320 字 (约 10 分钟)
85

李飞飞定义世界模型的三大功能:渲染、模拟和规划。

入选理由:世界模型具有渲染、模拟和规划三大功能。

精选文章#世界模型#渲染#模拟#规划#机器智能中文
MARBLE

Multi-Aspect Reward Balance for Diffusion RL

paper: https://t.co/7QCvgCHPQp

MARBLE:扩散强化学习的多方面奖励平衡

AK(@_akhaliq)49 字 (约 1 分钟)
78

MARBLE 提出一种多方面奖励平衡机制,显著提升扩散强化学习在复杂任务中的稳定性和性能,实验显示其在多个基准测试中优于现有方法。

入选理由:MARBLE 在 5 个复杂环境任务中平均提升策略成功率 23%

精选推文#强化学习#扩散模型#奖励设计#AI 生成英文

跨材料问答 · Marble

回答基于:Marble 相关 2 条材料
    0 / 500

    AI 可能会生成不准确的信息,请核实重要内容