Can AI truly edit audio, not just generate it? 🎧 Tencent Hy, in collaboration with SJTU, SII, NTU,...
腾讯混元联合多所高校推出MMAE,首个全面评估AI音频编辑能力的基准,揭示当前模型在精确编辑音频任务上的不足。
入选理由:MMAE包含2000个高质量真实场景音频样本,覆盖语音、音乐及混合类型。
产品
别名:arxiv.org
提供MMAE相关论文的学术平台。
已跟踪 6 条高相关材料
最近变化
2026-06-08 · MMAE包含2000个高质量真实场景音频样本,覆盖语音、音乐及混合类型。
为什么值得关注
arXiv 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。
Can AI truly edit audio, not just generate it? 🎧 Tencent Hy, in collaboration with SJTU, SII, NTU,...
Hunyuan(@TXhunyuan) · 8.5 分
腾讯混元联合多所高校推出MMAE,首个全面评估AI音频编辑能力的基准,揭示当前模型在精确编辑音频任务上的不足。
We're presenting ParseBench at CVPR 2026 today. 🦙 Come learn why document understanding is an AGI-...
LlamaIndex 🦙(@llama_index) · 8.5 分
LlamaIndex 推出 ParseBench,首个面向 AI 的文档解析基准,强调文档理解是实现 AGI 的关键挑战。
Woow Nvidia has just released a 2.6B open-source world model 🔥 You can turn a single image, text p...
Paul Couvert(@itsPaulAi) · 8.5 分
NVIDIA 发布了一个 26 亿参数的开源世界模型,可在单个 GPU 上运行,适用于多种应用场景。
已收录 6 条与 arXiv 相关的内容,按评分排序。
腾讯混元联合多所高校推出MMAE,首个全面评估AI音频编辑能力的基准,揭示当前模型在精确编辑音频任务上的不足。
入选理由:MMAE包含2000个高质量真实场景音频样本,覆盖语音、音乐及混合类型。
LlamaIndex 推出 ParseBench,首个面向 AI 的文档解析基准,强调文档理解是实现 AGI 的关键挑战。
入选理由:ParseBench 是首个面向 AI 的文档解析基准,包含 167K+ 测试规则。
NVIDIA 发布了一个 26 亿参数的开源世界模型,可在单个 GPU 上运行,适用于多种应用场景。
入选理由:NVIDIA 开源了 26 亿参数的世界模型,可在单个 GPU(如 RTX 5090 或 H100)上运行。
arXiv对伪造参考文献实施1年禁令,要求作者对论文内容负全责。
入选理由:arXiv将对伪造参考文献的作者实施1年禁令
文章提及世界模型发展迅速,但内容过于简略,缺乏技术细节和深度分析。
入选理由:世界模型(World Models)正在快速发展,未来可能在家庭环境中部署类似Genie 3的系统。
文章仅罗列五条简短科技新闻,无机制分析、数据支撑或工程洞察,属于信息聚合类推文,缺乏深度与实用价值。
入选理由:文章仅罗列五条简短科技新闻,无机制分析、数据支撑或工程洞察,属于信息聚合类推文,缺乏深度与实用价值