AI 应用层还没死，但要避开「Yellow Brick Road」！

@joeschmidtiv (a16z) 这篇文章指出：AI 应用层仍有巨大机会，但机会不在模型实验室正在全力押注的「通用智能体...

meng shao(@shao__meng)

meng shao(@shao__meng)2026年5月28日

AI 应用层还没死，但要避开「Yellow Brick Road」！ @joeschmidtiv (a16z) 这篇文章指出：AI 应用层仍有巨大机会，但机会不在模型实验室正在全力押注的「通用智能体...

8.5Score

TL;DR · AI 摘要

AI 应用层仍有巨大机会，但要避开通用智能体路径，专注于垂直、复杂、系统级的工作流。

核心要点

通用智能体路径（黄砖路）面临产品质量线性提升的挑战，难以与实验室竞争。
复杂、垂直、多步骤的问题是创业公司的机会所在，涉及可信、合规和可运营的解决方案。
实验室无法覆盖所有行业知识和变异性管理，应用公司通过定制界面和治理控制获得竞争优势。

结构提纲

按章节快速跳转。

§引言
AI 应用层仍有巨大机会，但机会不在通用智能体路径上。
·黄砖路的定义与风险
黄砖路指使用最强模型、现成连接器和简单 Agent 编排，做通用 AI 同事。
·Oz 其他地方的机会
机会在复杂、垂直、多步骤的问题上，涉及可信、合规和可运营的解决方案。
·实验室无法完全吞掉 Oz 其他地方的原因
数据与学习飞轮、模型变异性管理、成本优化和治理是关键因素。
·自检框架
通过工具与步骤测试、系统 vs 工具测试和对冲基金/P&L 测试判断是否在 Oz 其他地方。
·最终判断
两条路都会出大赢家，但模型层是可替换的，工作系统不可替代。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

AI 应用层机会

金句 / Highlights

值得收藏与分享的关键句。

黄砖路指使用最强模型、现成连接器和简单 Agent 编排，做通用 AI 同事。
— 第 4 段
⬇︎ 下载 PNG 𝕏 分享到 X
实验室无法覆盖所有行业知识和变异性管理，应用公司通过定制界面和治理控制获得竞争优势。
— 第 12 段
⬇︎ 下载 PNG 𝕏 分享到 X
模型层是可替换的（fungible）；工作系统不可替代。
— 第 20 段
⬇︎ 下载 PNG 𝕏 分享到 X

#AI 应用层#通用智能体#垂直应用#工作流#a16z

打开原文

@joeschmidtiv (a16z) 这篇文章指出：AI 应用层仍有巨大机会，但机会不在模型实验室正在全力押注的「通用智能体」路径上，而在垂直、复杂、系统级的「工作流深处」。

创始人、求职者普遍焦虑：OpenAI、Anthropic 会不会把应用层全部吃掉？ https://t.co/X7ImYhRoGA" / X

AI 应用层还没死，但要避开「Yellow Brick Road」！

(a16z) 这篇文章指出：AI 应用层仍有巨大机会，但机会不在模型实验室正在全力押注的「通用智能体」路径上，而在垂直、复杂、系统级的「工作流深处」。创始人、求职者普遍焦虑：OpenAI、Anthropic 会不会把应用层全部吃掉？ Schmidt 认为这种焦虑「对了一半」： · 对的部分：实验室确实会吞掉大量横向、通用、低复杂度的应用表面 · 错的部分：「应用层」不是铁板一块，不能一概而论他用《绿野仙踪》做比喻： · 黄砖路（Yellow Brick Road） = 实验室正在走的路 · Oz 的其他地方 = 创业公司该去的地方什么是「黄砖路」？为什么危险？黄砖路指：拿最强模型 + 现成连接器（Slack、Salesforce、GitHub 等）+ 简单 Agent 编排 → 做一个通用 AI 同事。问题在于，这正是 Cowork、Codex、Claude Code 在做的事。如果你做的是同样的连接器、同样的浅层编排、没有子 Agent 和深度配置、也没有分发——你是在跟实验室正面竞争，大概率是死路。黄砖路上的问题（代码生成、写作、图像等）有一个共同特征：产品质量随模型 raw capability 线性提升，每多投一美元预训练/后训练，产品就更好。这类问题天然适合实验室。「Oz 其他地方」的机会在哪里？机会在复杂、垂直、多步骤、多角色的问题上，价值不只来自模型能力，更来自让输出可信、合规、可运营的一整套脚手架。典型特征： · 跨系统 Gather context，再经多个人类审批节点 · 涉及 legacy 系统 · 需要确定性结果，不能容忍模糊 · 与真实商业结果绑定（成交、核保、合规审查）实验室自己也承认搞不定全部——所以才会砸重金做 forward-deployed joint ventures（派驻式联合项目），帮企业定制配置。如果「下一个模型版本就能解决」，他们不会投这笔钱。为什么实验室最终也「吞不掉」Oz 其他地方？ 1. 数据与学习飞轮 · 大量行业知识不在训练集里：未写下的规范、潜规则、从业者脑中的经验 · 两层飞轮： · 跨客户：同类问题的模式识别 · 单客户：该机构特有的例外与决策逻辑 · 横向工具难以设计合适的 UX 来捕获这些知识；垂直玩家可以围绕工作流定制界面 2. 模型变异性管理 · 实验室只能推自家模型；应用公司可以跨厂商选模型——不同子任务用最合适的（开源微调、竞品 API 等） · 还替客户做脏活：每次模型升级重跑 eval、针对 edge case 重调 prompt、平滑迁移 · 客户得到的是「全市场最优智能 + 升级连续性」，而非「请自行迁移到我们的新模型」 3. 成本优化 · 全走 Opus 4.7 = 负毛利 · 垂直公司按子任务路由：前沿模型做难题、中端做 bulk、自研/微调小模型做窄任务 · 实验室定的是「$X 能买到的最低智能」；应用公司卖的是「完成该工作流所需的最低 dollar cost」 4. 治理（Governance） · 成为客户在该垂直领域跑 AI 的控制平面：权限、审计、agent 能做什么、实际做了什么 · 吸收监管复杂度（HIPAA、SEC/FINRA、律师协会规则等） · 横向玩家无法同时成为「一百个垂直领域」的合规伙伴核心 trade-off：实验室必须 everywhere for everyone → 无法 great at one thing。三个自检框架：你在不在「Oz 其他地方」？测试 | 黄砖路（危险）| Oz 其他地方（机会） · 工具与步骤测试 | 一步、一个工具、结果可容错（如搜 Google Drive） | 多步、多工具、输出需过 partner/法庭/监管 · 系统 vs 工具测试 | 客户已有工作流上的「智能插件」；实验室出竞品客户可换掉你 | 客户通过你的系统跑工作；你是 orchestration layer · 对冲基金/P&L 测试 | 客户为 generic capability 付费（Claude seat 可替代）| 客户为 workflow-specific outcome 付费（成交、核保、合规）最终判断：两条路都会出大赢家 · 黄砖路：实验室赢——拥有模型 + 横向工具的分发 · Oz 其他地方：应用公司赢——若拥有 system of work（工作执行面、数据捕获、治理）模型层是可替换的（fungible）；工作系统不可替代。新一代 enterprise software 会建在路上之外——应用公司成为整合并交付各类新模型的层，而客户依赖的是那套系统。