T
traeai
登录
返回首页
Augment Code(@augmentcode)

Augment Code on X: "We don't need more agents. We need a better system. So we built one."

8.9Score
Augment Code on X: "We don't need more agents. We need a better system. So we built one."

TL;DR · AI 摘要

Augment Cosmos是面向代理软件开发的操作系统,通过统一系统和多模型支持提升团队生产力。

核心要点

  • Cosmos通过共享上下文和自我改进的代理循环提高团队协作效率。
  • 未来软件工厂将完全由代理驱动,预计年底模型能力将是Opus 4.5的10倍。
  • 保持模型无关性可以避免锁定单一供应商带来的成本和迁移风险。

结构提纲

按章节快速跳转。

  1. Augment Cosmos是面向代理软件开发的操作系统,提供跨环境运行的代理。

  2. 没有统一系统,工程师各自为战,导致设置碎片化和专业知识孤立。

  3. 随着模型能力增强,未来软件开发将主要依赖代理。

  4. 保持模型无关性可以避免锁定单一供应商带来的成本和迁移风险。

思维导图

用一张图看清主题之间的关系。

查看大纲文本(无障碍 / 无 JS 友好)
  • Augment Cosmos
    • 系统需求
      • 共享上下文
      • 自我改进
    • 未来趋势
      • 代理驱动
      • 模型增强
    • 模型无关性
      • 避免锁定
      • 降低成本

金句 / Highlights

值得收藏与分享的关键句。

#Augment Cosmos#代理软件开发#SDLC
打开原文

标题:在 X 上增强代码:“我们不需要更多的代理。我们需要一个更好的系统。所以我们构建了一个。” / X

URL 源: https://x.com/augmentcode/status/2051350118360891584

Markdown 内容: 今天,我们将 Augment Cosmos 推出公开预览版。Cosmos 是代理软件开发的操作系统:这些代理可以在任何地方运行(您的环境、我们的云)并在整个 SDLC 中工作,人类在需要判断的地方进行引导。

此外,Cosmos 是为团队而建的:共享上下文和内存、自我改进的代理循环、连接到您所有的工具,默认情况下支持多模型。

图片 1: 图片

一个用于代理软件开发的操作系统。

对我们来说,分享最有用的东西不是发布了什么,而是为什么我们需要构建它。

  1. 没有系统就无法改变组织。

我们与之交谈的每一位工程领导者都经历了同样的脱节。99% 的工程师已经采用了代理。编写的代码比以往任何时候都多。但这种生产力提升并没有转化为组织的进步。

几个月前我们在 [文章链接] 中写过这个问题。拥有新技术是不够的,你还需要系统和人员来适应变化。

当个人采用代理而没有统一的系统时,会出现四个问题。

  • 设置碎片化:每个工程师都建立自己的工作流程,没有任何共享模式。
  • 专业知识被困:找到优秀提示以供计费服务使用的工程师将其保存在他们的配置中,其他地方都没有。
  • 没有质量信号:无法知道哪些代理设置实际上在团队之间有效。
  • 审查瓶颈变得更糟,而不是更好:只有在最终 PR 时才会有人类介入,而这正是解决问题成本最高的时候。
  1. 未来的软件工厂将完全由代理驱动。

去年 11 月的 Opus 4.5 时刻是第一次有大量严肃的软件工程师同意手动编写大多数代码不再有意义。

按照模型改进的速度,到今年年底我们将拥有能力比 Opus 4.5 强 10 倍的模型!这是一个惊人的现实:不久的将来会有能力比改变了人们编码方式的模型强 10 倍的模型。在那个世界里,我们构建软件的方式将与过去几十年大不相同。

我们相信未来是由小团队的人与大团队的代理合作:在整个 SDLC 中使用代理的代理工程。直到 Cosmos 出现之前,这种工作方式的工具并不存在。

  1. 您的代理 SDLC 需要与模型无关。

最近的跳跃(Opus 4.7、GPT‑5.5)显示了模型改进速度有多快。编码几乎成为了一个已解决的问题,但我们预计模型开发将继续,并专注于更大更难的任务。这意味着最先进的模型很快就会对软件任务过于强大。默认使用前沿模型来做所有事情将是浪费且昂贵的。理性的选择是找到最佳的成本/质量模型组合来完成工作。

锁定在一个供应商上,你就继承了他们的定价、路线图以及当你需要多样化时必须支付的迁移税。保持模型无关可以避免这个陷阱。

这就是我们正在构建的方向。

个体生产力从代理中获得的实际收益是真实的。工程师们比以往任何时候都交付了更多代码。但是组织并没有感觉到生产力提高了 10 倍,因为工作仍然围绕着人类在每一步中的介入。综合反馈。在会议和线程中分类。研究问题。编写规范。与代理一起编码。与代理一起测试。审查 PR。发布和监控。这是在一个产品改进循环中的八次中断。

下一阶段不是人类做而代理辅助,而是代理做而人类引导。

有了 Cosmos,八次中断变成了三个检查点。

图片 2: 图片

优先级排序。与其从早上开始在 Slack 中阅读反馈频道,不如让代理一直在那里:监控、聚合信号、寻找模式。当你坐在办公桌前时,它会提出当天的优先事项。你只需审核。

这里有两种重要的反馈。第一种很明显:你可以纠正优先事项本身。一条 Slack 回复就够了。但第二种更重要:你可以纠正思维模型。“对于这种类型的反馈,今后优先级排序应该这样工作。” 代理会记住,所以明天的优先级排序会变得更好。

人类的杠杆作用从进行优先级排序转移到教授优先级函数。一旦列表确认,Cosmos 可以启动并行代理来打开 PR 或尝试工作。规范返回给你审核,因为我们相信未来是以结果为导向的,人类的工作是在代理独立编写、测试和审查代码之前查看规范。

通过规范和意图审查实现上下文理解。代码审查是我们的一次顿悟。现有的每一个代码审查工具都是基于一个即将错误的假设:一个人在阅读代码。因此它们优化了精确度:展示最重要的问题,减少噪音,尊重读者的时间。

但如果审查者是代理,你不需要精确度。你需要召回率。你想抓住每一个可能的 bug。这是一个根本不同的产品。我们称之为深度代码审查,而且它只在不要求人类阅读输出的情况下才有效。

那么人类如何了解变化的情况呢?经过大量的实验,我们找到了一种体验,即人类与代理和 PR 共同工作以理解代码库的演变:这种体验揭示了关键假设正在转移的地方,以及人类应该真正关注的事情。这就是人类如何维持对代码库的理解,正如我们所发现的那样,

这对于有信心地发布产品至关重要。

在我们为云代理平台构建原语时,出现了一些更为强大的东西。我们意识到我们真正想要的是能够记住并根据反馈变得更好的专业代理,而不仅仅是能执行任务的代理。

通过不同的设计代理,赋予它们共享内存,并使系统能够自我更新,我们解锁了更像队友工作的代理。Augment 中最清晰的例子是我们的测试代理 Milo。我们尝试在一开始就将所有关于 Augment 测试方法的上下文加载到 Milo 中。我们所知道的一切都在其上下文窗口中。但这种方法失败了。成功的方法不同。我们将 Milo 的范围限定为 Augment 最佳的测试专家,并针对持续学习和记忆进行了调优。当 Milo 运行测试并遇到困难时,Slack 上的一位工程师会跳出来指导他们。Milo 被设计成从对话中提炼重要信息并存储起来。

专业代理的力量在于它们可以通过反馈变得更好。随着时间的推移,它们将成为您环境中特定任务的最佳代理,这是任何现成的代理都无法做到的。

现在还处于早期阶段,存在一些粗糙的边缘。我们分享它是因为我们宁愿与少数团队一起公开学习,而不是私下里进行打磨。

个人采用并不等于组织转型。如果您一直在阅读,如果您是一位工程领导者,看到个人采用领先于组织影响,看到专业知识被困住,看到审核队列增长,我们很乐意将 Cosmos 展示给您,并共同学习。

撰写者:

AI 可能会生成不准确的信息,请核实重要内容