AI 应用层还没死,但要避开「Yellow Brick Road」! @joeschmidtiv (a16z) 这篇文章指出:AI 应用层仍有巨大机会,但机会不在模型实验室正在全力押注的「通用智能体...

TL;DR · AI 摘要
AI 应用层仍有巨大机会,但要避开通用智能体路径,专注于垂直、复杂、系统级的工作流。
核心要点
- 通用智能体路径(黄砖路)面临产品质量线性提升的挑战,难以与实验室竞争。
- 复杂、垂直、多步骤的问题是创业公司的机会所在,涉及可信、合规和可运营的解决方案。
- 实验室无法覆盖所有行业知识和变异性管理,应用公司通过定制界面和治理控制获得竞争优势。
结构提纲
按章节快速跳转。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- AI 应用层机会
金句 / Highlights
值得收藏与分享的关键句。
黄砖路指使用最强模型、现成连接器和简单 Agent 编排,做通用 AI 同事。
实验室无法覆盖所有行业知识和变异性管理,应用公司通过定制界面和治理控制获得竞争优势。
模型层是可替换的(fungible);工作系统不可替代。
@joeschmidtiv (a16z) 这篇文章指出:AI 应用层仍有巨大机会,但机会不在模型实验室正在全力押注的「通用智能体」路径上,而在垂直、复杂、系统级的「工作流深处」。
创始人、求职者普遍焦虑:OpenAI、Anthropic 会不会把应用层全部吃掉? https://t.co/X7ImYhRoGA" / X
AI 应用层还没死,但要避开「Yellow Brick Road」!
(a16z) 这篇文章指出:AI 应用层仍有巨大机会,但机会不在模型实验室正在全力押注的「通用智能体」路径上,而在垂直、复杂、系统级的「工作流深处」。创始人、求职者普遍焦虑:OpenAI、Anthropic 会不会把应用层全部吃掉? Schmidt 认为这种焦虑「对了一半」: · 对的部分:实验室确实会吞掉大量横向、通用、低复杂度的应用表面 · 错的部分:「应用层」不是铁板一块,不能一概而论 他用《绿野仙踪》做比喻: · 黄砖路(Yellow Brick Road) = 实验室正在走的路 · Oz 的其他地方 = 创业公司该去的地方 什么是「黄砖路」?为什么危险? 黄砖路指:拿最强模型 + 现成连接器(Slack、Salesforce、GitHub 等)+ 简单 Agent 编排 → 做一个通用 AI 同事。 问题在于,这正是 Cowork、Codex、Claude Code 在做的事。 如果你做的是同样的连接器、同样的浅层编排、没有子 Agent 和深度配置、也没有分发——你是在跟实验室正面竞争,大概率是死路。 黄砖路上的问题(代码生成、写作、图像等)有一个共同特征:产品质量随模型 raw capability 线性提升,每多投一美元预训练/后训练,产品就更好。这类问题天然适合实验室。 「Oz 其他地方」的机会在哪里? 机会在复杂、垂直、多步骤、多角色的问题上,价值不只来自模型能力,更来自让输出可信、合规、可运营的一整套脚手架。 典型特征: · 跨系统 Gather context,再经多个人类审批节点 · 涉及 legacy 系统 · 需要确定性结果,不能容忍模糊 · 与真实商业结果绑定(成交、核保、合规审查) 实验室自己也承认搞不定全部——所以才会砸重金做 forward-deployed joint ventures(派驻式联合项目),帮企业定制配置。如果「下一个模型版本就能解决」,他们不会投这笔钱。 为什么实验室最终也「吞不掉」Oz 其他地方? 1. 数据与学习飞轮 · 大量行业知识不在训练集里:未写下的规范、潜规则、从业者脑中的经验 · 两层飞轮: · 跨客户:同类问题的模式识别 · 单客户:该机构特有的例外与决策逻辑 · 横向工具难以设计合适的 UX 来捕获这些知识;垂直玩家可以围绕工作流定制界面 2. 模型变异性管理 · 实验室只能推自家模型;应用公司可以跨厂商选模型——不同子任务用最合适的(开源微调、竞品 API 等) · 还替客户做脏活:每次模型升级重跑 eval、针对 edge case 重调 prompt、平滑迁移 · 客户得到的是「全市场最优智能 + 升级连续性」,而非「请自行迁移到我们的新模型」 3. 成本优化 · 全走 Opus 4.7 = 负毛利 · 垂直公司按子任务路由:前沿模型做难题、中端做 bulk、自研/微调小模型做窄任务 · 实验室定的是「$X 能买到的最低智能」;应用公司卖的是「完成该工作流所需的最低 dollar cost」 4. 治理(Governance) · 成为客户在该垂直领域跑 AI 的控制平面:权限、审计、agent 能做什么、实际做了什么 · 吸收监管复杂度(HIPAA、SEC/FINRA、律师协会规则等) · 横向玩家无法同时成为「一百个垂直领域」的合规伙伴 核心 trade-off:实验室必须 everywhere for everyone → 无法 great at one thing。 三个自检框架:你在不在「Oz 其他地方」? 测试 | 黄砖路(危险)| Oz 其他地方(机会) · 工具与步骤测试 | 一步、一个工具、结果可容错(如搜 Google Drive) | 多步、多工具、输出需过 partner/法庭/监管 · 系统 vs 工具测试 | 客户已有工作流上的「智能插件」;实验室出竞品客户可换掉你 | 客户通过你的系统跑工作;你是 orchestration layer · 对冲基金/P&L 测试 | 客户为 generic capability 付费(Claude seat 可替代)| 客户为 workflow-specific outcome 付费(成交、核保、合规) 最终判断:两条路都会出大赢家 · 黄砖路:实验室赢——拥有模型 + 横向工具的分发 · Oz 其他地方:应用公司赢——若拥有 system of work(工作执行面、数据捕获、治理) 模型层是可替换的(fungible);工作系统不可替代。 新一代 enterprise software 会建在路上之外——应用公司成为整合并交付各类新模型的层,而客户依赖的是那套系统。