1、Most RL stacks are built for one modality. UniRL applies a single post-training loop — generate → ...
UniRL 是一个统一的强化学习框架,支持多种模态和模型,通过单一训练循环实现跨模型家族的训练。
入选理由:UniRL 使用单一训练循环(generate → score → advantage → update → sync)支持多种模态和模型。
公司
别名:腾讯
中国科技公司,开发了 UniRL 框架。
已跟踪 5 条高相关材料
最近变化
2026-06-09 · UniRL 使用单一训练循环(generate → score → advantage → update → sync)支持多种模态和模型。
为什么值得关注
Tencent 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。
1、Most RL stacks are built for one modality. UniRL applies a single post-training loop — generate → ...
Hunyuan(@TXhunyuan) · 8.5 分
UniRL 是一个统一的强化学习框架,支持多种模态和模型,通过单一训练循环实现跨模型家族的训练。
🚀 Open-source upgrade unlocked. Tencent Hy-MT2 is now under Apache License 2.0 — maximum freedom f...
Hunyuan(@TXhunyuan) · 8 分
Tencent Hy-MT2 现已开源,采用 Apache License 2.0 许可证,提供最大自由度供研究、商业使用、微调和衍生品开发。
Woow Tencent has released a model 100% open source which is better than Google Translate... And it ...
Paul Couvert(@itsPaulAi) · 6.8 分
腾讯发布了一款开源翻译模型,性能优于Google Translate且仅需440MB空间即可在手机上离线运行。
已收录 5 条与 Tencent 相关的内容,按评分排序。
UniRL 是一个统一的强化学习框架,支持多种模态和模型,通过单一训练循环实现跨模型家族的训练。
入选理由:UniRL 使用单一训练循环(generate → score → advantage → update → sync)支持多种模态和模型。
Tencent Hy-MT2 现已开源,许可证为 Apache License 2.0,提供最大自由度供研究、商业使用、微调和衍生品开发。
入选理由:Tencent Hy-MT2 开源,许可证为 Apache License 2.0。
腾讯Hy3预览版的token使用量比上一代增长了10倍,主要由编码和代理工作负载驱动。
入选理由:Hy3的token使用量相比Hy2增长了10倍。
腾讯发布了一款开源翻译模型,性能优于Google Translate且仅需440MB空间即可在手机上离线运行。
入选理由:腾讯新模型支持33种语言,体积仅为440MB,适合移动设备使用。
腾讯与人大高岭人工智能学院发布 PlanningBench,开源可扩展、可验证的 LLM 规划评估与训练框架,包含 30+ 真实规划任务与自动验证功能。
入选理由:PlanningBench 提供 30+ 真实规划任务,支持 LLM 规划能力评估。