T
traeai
登录

人物

ClementDelangue

别名:clem

推文作者,Hugging Face 社区成员,关注开源 AI 技术发展。

已跟踪 7 条高相关材料

TraeAI 观察

相关材料

已收录 7 条与 ClementDelangue 相关的内容,按评分排序。

Most people training agentic LLMs with RL right now have a silently broken training loop and have no...

大多数正在使用强化学习(RL)训练代理LLM的人现在有一个默默损坏的训练循环,他们对此一无所知。单轮RL效果非常好,但当添加工具使模型能在回合中行动时,情况变得复杂,损失会出现无故尖峰,最终导致形状不匹配错误。原因在于每次解析模型输出、检测工具调用、重新标记更新后的对话,都会带来潜在风险。解决方法是遵循一个规则:永远不要重新编码已经解码的标记。保持采样标记在一个缓冲区中,从不重新渲染它们,两种失败模式都会消失。

入选理由:单轮RL效果好,但加入工具后需小心处理,避免形状不匹配错误。

精选推文#强化学习#LLM中文
Arcee needs more attention that it gets! There aren't a lot of great American open-source AI model c...

Arcee 需要更多关注!

clem 🤗(@ClementDelangue)82 字 (约 1 分钟)
35

推文呼吁关注 Arcee 公司,但内容缺乏深度和实用性,仅为简单推荐。

入选理由:Arcee 是一家美国开源 AI 模型公司,但未提供具体模型或技术细节。

精选推文#AI#开源#美国公司#Arcee英文
@josefchen Nice! Could you add the model and dataset to HF?

@josefchen Nice! Could you add the model and dataset to HF?

clem 🤗(@ClementDelangue)47 字 (约 1 分钟)
25

ClementDelangue 请求 Josefchen 将模型和数据集添加到 HF。

入选理由:ClementDelangue 请求将模型和数据集添加到 HF。

精选推文#Hugging Face#数据集#模型中文
Did @Jason just pull up in Miami?

Did @Jason 刚刚抵达迈阿密?

clem 🤗(@ClementDelangue)50 字 (约 1 分钟)
25

ClementDelangue 在 X 上发布了一张照片,询问 Jason 是否刚抵达迈阿密。

入选理由:ClementDelangue 发布了关于 Jason 抵达迈阿密的推文。

精选推文#社交媒体#X英文

跨材料问答 · ClementDelangue

回答基于:ClementDelangue 相关 7 条材料
    0 / 500

    AI 可能会生成不准确的信息,请核实重要内容