本周 HuggingFace 热度第一的论文：RecursiveMAS（递归多Agent系统）

多个 AI 组队协作，现在已经是主流方案。

模型 A 想好了传给模型 B，模型 B 想好了传给模型 ...

向阳乔木(@vista8)

向阳乔木(@vista8)2026年5月2日

本周 HuggingFace 热度第一的论文：RecursiveMAS（递归多Agent系统）多个 AI 组队协作，现在已经是主流方案。模型 A 想好了传给模型 B，模型 B 想好了传给模型 ...

7.8Score

TL;DR · AI 摘要

RecursiveMAS 提出 Agent 间直接传递内部向量而非文本，减少 token 翻译开销，在数学推理任务上提升 13–18 个百分点，推理快 2.4×，Token 节省 75%。

核心要点

Agent 协作中文字中转导致严重信息损失与计算冗余
RecursiveMAS 用轻量向量接口替代文本通信，形成递归闭环
仅训练小型‘传话模块’，底层模型冻结，训练成本低于 LoRA

结构提纲

按章节快速跳转。

§背景：多 Agent 协作的瓶颈
当前主流多 Agent 系统依赖文本中继，造成翻译损耗与信号衰减。
·核心创新：向量级递归通信
Agent 间跳过文本生成/理解，直接交换隐状态向量，构建递归迭代闭环。
·轻量训练范式
仅微调极小的跨 Agent 映射模块，基座模型完全冻结。
›实证优势
在 AIME 数学竞赛任务上显著超越基线，且随递归轮次增加收益放大。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

RecursiveMAS：向量级递归多 Agent 系统
- 问题根源
  - 文本中继导致翻译损耗
  - 信号回传弱化
  - Token 开销随轮次指数增长
- 关键技术
  - 隐状态向量直连
  - 单点输出文本
  - 冻结基座 + 小模块微调
- 实证效果
  - AIME +13–18pt
  - 推理加速 2.4×
  - Token 减少 75%

金句 / Highlights

值得收藏与分享的关键句。

每次交接都要把内部计算结果'翻译'成 token，下一个模型再重新'读懂'，再翻译……轮次越多，无效开销越多，而且会影响学习信号回传。
— 第 1 段
⬇︎ 下载 PNG 𝕏 分享到 X
Agent 之间不传文字，直接传模型内部的数值向量。形成一个递归闭环，迭代打磨，只有最后一轮输出文本答案。
— 第 2 段
⬇︎ 下载 PNG 𝕏 分享到 X
连接模块极其轻量，底层模型全程不动，只训练中间那个'传话'的小模块。
— 第 2 段
⬇︎ 下载 PNG 𝕏 分享到 X
AIME 顶级数学竞赛题上，比最强基线高 13–18 个百分点。推理速度快 2.4×，Token 用量少 75%，训练成本比 LoRA 还低。
— 第 2 段
⬇︎ 下载 PNG 𝕏 分享到 X

#Multi-Agent#LLM#Recursive Reasoning#HuggingFace#AI Systems

打开原文

多个 AI 组队协作，现在已经是主流方案。

模型 A 想好了传给模型 B，模型 B 想好了传给模型 C，一棒接一棒。

但传的东西是文字。

每次交接都要把内部计算结果"翻译"成 token，下一个模型再重新"读懂"，再翻译……" / X

向阳乔木 on X: "本周 HuggingFace 热度第一的论文：RecursiveMAS（递归多Agent系统）多个 AI 组队协作，现在已经是主流方案。模型 A 想好了传给模型 B，模型 B 想好了传给模型 C，一棒接一棒。但传的东西是文字。每次交接都要把内部计算结果"翻译"成 token，下一个模型再重新"读懂"，再翻译……" / X

Don’t miss what’s happening

向阳乔木

@vista8

Show translation

本周 HuggingFace 热度第一的论文：RecursiveMAS（递归多Agent系统）多个 AI 组队协作，现在已经是主流方案。模型 A 想好了传给模型 B，模型 B 想好了传给模型 C，一棒接一棒。但传的东西是文字。每次交接都要把内部计算结果"翻译"成 token，下一个模型再重新"读懂"，再翻译…… 轮次越多，无效开销越多，而且会影响学习信号回传。 RecursiveMAS 做法： Agent 之间不传文字，直接传模型内部的数值向量。形成一个递归闭环，迭代打磨，只有最后一轮输出文本答案。连接模块极其轻量，底层模型全程不动，只训练中间那个"传话"的小模块。 AIME 顶级数学竞赛题上，比最强基线高 13-18 个百分点。推理速度快 2.4×，Token 用量少 75%，训练成本比 LoRA 还低。且递归轮次越多，优势越大。论文地址见评论区，有空可以翻译下。

1:43 AM · May 2, 2026

·

11.3K Views

20

10

100

113

Read 20 replies

本周 HuggingFace 热度第一的论文：RecursiveMAS（递归多Agent系统） 多个 AI 组队协作，现在已经是主流方案。 模型 A 想好了传给模型 B，模型 B 想好了传给模型 ...