向阳乔木(@vista8)
本周 HuggingFace 热度第一的论文:RecursiveMAS(递归多Agent系统) 多个 AI 组队协作,现在已经是主流方案。 模型 A 想好了传给模型 B,模型 B 想好了传给模型 ...
7.8Score

TL;DR · AI 摘要
RecursiveMAS 提出 Agent 间直接传递内部向量而非文本,减少 token 翻译开销,在数学推理任务上提升 13–18 个百分点,推理快 2.4×,Token 节省 75%。
核心要点
- Agent 协作中文字中转导致严重信息损失与计算冗余
- RecursiveMAS 用轻量向量接口替代文本通信,形成递归闭环
- 仅训练小型‘传话模块’,底层模型冻结,训练成本低于 LoRA
结构提纲
按章节快速跳转。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- RecursiveMAS:向量级递归多 Agent 系统
- 问题根源
- 文本中继导致翻译损耗
- 信号回传弱化
- Token 开销随轮次指数增长
- 关键技术
- 隐状态向量直连
- 单点输出文本
- 冻结基座 + 小模块微调
- 实证效果
- AIME +13–18pt
- 推理加速 2.4×
- Token 减少 75%
金句 / Highlights
值得收藏与分享的关键句。
每次交接都要把内部计算结果'翻译'成 token,下一个模型再重新'读懂',再翻译……轮次越多,无效开销越多,而且会影响学习信号回传。
Agent 之间不传文字,直接传模型内部的数值向量。形成一个递归闭环,迭代打磨,只有最后一轮输出文本答案。
连接模块极其轻量,底层模型全程不动,只训练中间那个'传话'的小模块。
AIME 顶级数学竞赛题上,比最强基线高 13–18 个百分点。推理速度快 2.4×,Token 用量少 75%,训练成本比 LoRA 还低。
#Multi-Agent#LLM#Recursive Reasoning#HuggingFace#AI Systems
打开原文多个 AI 组队协作,现在已经是主流方案。
模型 A 想好了传给模型 B,模型 B 想好了传给模型 C,一棒接一棒。
但传的东西是文字。
每次交接都要把内部计算结果"翻译"成 token,下一个模型再重新"读懂",再翻译……" / X
向阳乔木 on X: "本周 HuggingFace 热度第一的论文:RecursiveMAS(递归多Agent系统) 多个 AI 组队协作,现在已经是主流方案。 模型 A 想好了传给模型 B,模型 B 想好了传给模型 C,一棒接一棒。 但传的东西是文字。 每次交接都要把内部计算结果"翻译"成 token,下一个模型再重新"读懂",再翻译……" / X
Don’t miss what’s happening

Show translation
本周 HuggingFace 热度第一的论文:RecursiveMAS(递归多Agent系统) 多个 AI 组队协作,现在已经是主流方案。 模型 A 想好了传给模型 B,模型 B 想好了传给模型 C,一棒接一棒。 但传的东西是文字。 每次交接都要把内部计算结果"翻译"成 token,下一个模型再重新"读懂",再翻译…… 轮次越多,无效开销越多,而且会影响学习信号回传。 RecursiveMAS 做法: Agent 之间不传文字,直接传模型内部的数值向量。 形成一个递归闭环,迭代打磨,只有最后一轮输出文本答案。 连接模块极其轻量,底层模型全程不动,只训练中间那个"传话"的小模块。 AIME 顶级数学竞赛题上,比最强基线高 13-18 个百分点。 推理速度快 2.4×,Token 用量少 75%,训练成本比 LoRA 还低。 且递归轮次越多,优势越大。 论文地址见评论区,有空可以翻译下。
·
20
10
100
113
Read 20 replies