How will OpenAI compete?

TL;DR · AI 摘要
OpenAI面临四大战略问题,包括缺乏独特技术和产品、市场快速发展带来的挑战、跨过‘混乱中间地带’的难题以及产品策略受限。
核心要点
- OpenAI缺乏独特技术和产品。
- 市场快速发展带来巨大挑战。
- OpenAI需跨过‘混乱中间地带’难题。
结构提纲
按章节快速跳转。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- OpenAI的竞争策略
金句 / Highlights
值得收藏与分享的关键句。
OpenAI没有独特技术或产品,用户基数大但参与度低。
市场发展迅速,竞争对手众多,OpenAI需不断创新。
OpenAI需在资本密集型行业中应对挑战,缺乏现有产品的支持。
OpenAI 如何竞争?
OpenAI 面临着一些重大问题。它没有独特技术。它拥有庞大的用户基础,但参与度有限且粘性不足,也没有网络效应。现有企业已经匹配了技术,并利用其产品和分销渠道。许多价值和杠杆作用将来自尚未发明的新体验,而 OpenAI 无法独自发明所有这些新体验。那么它的计划是什么?
_"Jakub 和 Mark 为长期研究方向设定路线。经过数月的工作,一些不可思议的事情出现了,我会收到研究人员发来的消息说:‘我有一个相当酷的东西。你打算如何在聊天中使用它?你打算如何将其用于我们的企业产品?’_
_- OpenAI 产品负责人 Fidji Simo,_2026
_"你必须从客户体验开始,然后倒推到技术。你不能从技术开始,试图弄清楚你要在哪里销售它。”_
_- Steve Jobs,_1997
在我看来,OpenAI 有四个根本性的战略问题。
首先,我们今天看到的业务并没有一个强大而明确的竞争优势。它没有独特技术和产品。模型拥有非常庞大的用户基础,但参与度狭窄且粘性不足,也没有网络效应或其他赢家通吃的效应,这使得将用户基础转化为更广泛和持久的东西变得困难。OpenAI 本身也没有基于模型的消费者产品,这些产品具有市场契合度。
其次,随着市场的不断发展,未来几年内,人工智能领域的体验、产品、价值捕获和战略杠杆将会发生巨大的变化。大型激进的现有企业和成千上万的企业家正在尝试创造新的功能、体验和商业模式,并在此过程中试图将基础模型本身变成以边际成本出售的商品基础设施。作为大型语言模型(LLM)热潮的发起者,OpenAI 现在不仅需要发明一系列新的东西,还需要抵御、吸收和同化成千上万试图做同样事情的人。
第三,虽然这种情况也适用于该领域中的其他人,但与 Anthropic 类似,OpenAI 必须跨越“混乱的中间地带”,即所谓的“跨越鸿沟”(插入你最喜欢的创业书籍标题),而没有现有的产品可以作为分销渠道,使这一切成为一种功能。同时,它要在历史上资本密集度最高的行业中竞争,而没有来自现有业务的现金流来依赖。当然,那些拥有这一切的公司也需要能够颠覆自己,但我们早已过了人们认为谷歌不能做人工智能的时代。
第四个问题体现在我引用的上述引言中。Mike Krieger 和 Kevin Weil 去年也提出了类似的观点:当你是一家人工智能实验室的产品负责人时,你并不控制你的路线图。你几乎没有能力制定产品策略。你早上打开电子邮件,发现实验室已经解决了某个问题,而你的工作就是把这个解决方案变成一个按钮。策略发生在其他地方。但是,策略发生在何处?
OpenAI 至少可以说仍然在为新模型设定议程,并且拥有很多优秀技术和很多聪明且雄心勃勃的人。但与 2000 年代的谷歌或 2010 年代的苹果不同,这些人没有一个已经非常成功且别人无法复制的东西。我认为,你可以把 OpenAI 在过去 12 个月内的活动看作是,Sam Altman 深刻意识到这一点,并试图在音乐停止之前,通过他的纸张交易换取更持久的战略地位。
让我们先从模型开始。
有许多基准测试,所有的基准测试都是“错误”的,但它们都展示了相同的画面。
目前大约有六家组织正在发布具有几乎相同能力的前沿模型。每隔几周,它们就会互相超越。这些能力内部存在差异,有可能掉出曲线(例如 Meta 目前的情况),或者未能进入曲线(例如苹果、亚马逊、微软目前的情况),或者落后于前沿六个月(例如中国),或者严重依赖他人的工作(再次提到中国)。所有这些都需要大量的资金(关于这一点下面会详细讨论),但目前我们不知道有任何机制可以让一家公司在该领域获得其他公司永远无法匹敌的优势。这没有相当于从 Windows 到谷歌搜索再到 iOS 再到 Instagram 的网络效应,其中市场份额是自我强化的,无论投入多少金钱和努力,都无法让其他人闯入或赶上。
如果有一种突破能够启用网络效应,最明显的是持续学习,这种情况可能会改变,但我们不能计划这种突破会发生。这也可能因为访问专有数据的实用规模效应而改变,而今天专有数据是人工智能的暗物质:这可能是用户数据(但不清楚这个规模会是什么样子,而且现有的平台公司已经有很多),或者是垂直数据(基础模型不了解 SAP 或 Salesforce 内部发生了什么,也没有来自投资银行内部的数百万份电子表格,尽管有时你可以购买这些数据或付费让人制作,但其他大玩家也可以这样做)。这里可能还有其他因素,但目前我们不知道,也不能计划,所以我们必须假设模型在短期内仍将非常接近。
OpenAI 目前在用户基数方面确实有明显优势:它拥有 8-9 亿用户。问题是,这些用户大多是“每周活跃”用户:即使那些已经知道这是什么并且知道如何使用它的大多数人也没有将其变成每天的习惯。只有 5% 的 ChatGPT 用户是付费用户,即使是美国青少年也更有可能每周使用几次或更少,而不是每天多次使用。OpenAI 在其“2025 年度回顾”推广中发布的数据显示,80% 的用户在 2025 年发送的消息不到 1,000 条。我们不知道这一数据在这一年中发生了多大变化(可能有所增长),但至少表面上看,这平均下来每天不到三个提示,而且许多用户的聊天次数更少。使用量很广,但深度不足。
这意味着大多数人不会注意到模型个性和重点方面的差异,大多数人也无法从“记忆”或其他功能中受益,这些功能是各公司产品团队互相复制的,希望借此增加粘性(记忆就是粘性,不是网络效应)。同时,来自更大(目前)用户基数的数据本身可能是一个优势,但如果 80% 的用户最多只是一周使用几次,那么这个优势有多大?
这种参与度显然是一个“半杯水还是半空杯”的问题,但这应该是一种改变你使用计算机的方式。如果人们最多一周只使用几次,并且在普通日子里想不出任何用途,那它就没有改变他们的生活。OpenAI 自己也承认了这个问题,谈论所谓的“能力差距”,即模型能做什么与人们实际用它们做什么之间的差距,这在我看来更像是为了避免说你们没有明确的产品市场契合度。
因此,OpenAI 的广告项目部分是为了覆盖 90% 或更多不付费用户的成本(并抓住早期的广告商和早期学习的机会),但更有战略意义的是,希望通过提供最新最强大的(即昂贵的)模型来加深这些用户的参与度。Fidji Simo 在这里表示,“扩散和规模是最重要的。” 这可能有效(尽管这也可能促使他们付费,或者转向 Gemini)。但是,如果有人今天或本周都想不出任何使用 ChatGPT 的理由,那么给他们更好的模型是否会有改变?可能会,但也同样有可能他们被困在空白屏幕的问题上,或者无论模型有多好,聊天机器人本身并不适合他们的应用场景。
与此同时,当你有一个无差异化的产品时,早期的采用领先往往难以持久,竞争往往会转向品牌和分销。我们可以看到这一点在 Gemini 和 Meta AI 的市场份额迅速增长中体现出来:对于普通用户来说,这些产品看起来非常相似(尽管科技界的人士认为 Llama 4 是一场灾难,Meta 的数据似乎还不错),而谷歌和 Meta 则可以利用其分销渠道。相反,Anthropic 的 Claude 模型经常在基准测试中名列前茅,但它没有消费者策略或产品(Claude Cowork 要求你安装 Git!),并且几乎没有消费者的认知。
这导致许多人将 ChatGPT 与 Netscape 进行比较,在那里微软利用分销渠道强行进入一个很难区分产品的市场,就像谷歌和 Meta 今天所做的那样。
进一步来看,比较一下在浏览器时代很难区分浏览器与现在很难区分聊天机器人的难度是有意思的:这看起来像是同一个问题。你可以在浏览器中改进渲染引擎,也可以在聊天机器人中改进 LLM,但浏览器本身和聊天机器人本身只是一个输入框和一个输出框。ChatGPT 应用程序和其他聊天机器人应用程序一样,只是一个“薄包装”——你怎么可能让它与众不同?在浏览器中,答案是你不能——最后一个成功的产品创新是标签页和将搜索与 URL 栏合并。今天的聊天机器人也有同样的问题——你能添加多少小按钮,以及如何区分它们?
最终,尽管微软赢得了第一代消费互联网时代的浏览器之战,但这并不重要,因为真正重要的体验和价值创造是在其他地方实现的。同样地,对于“参与度差距”的真正问题在于,这是否通过普遍的模型改进来解决,我们假设这将适用于整个行业,或者通过 UI 创新来解决,而所有人都会复制这些创新,或者是否随后会出现基于“原始”模型的新实验和用例的发明和创建。
如果下一步是这些新的体验,谁会做到这一点,为什么会是 OpenAI?整个科技行业都在试图发明生成式 AI 体验的第二步——你如何计划让它成为你?你如何与这张图表竞争——硅谷的每一个企业家?
所以:你不知道如何使自己的核心技术比别人更好。你有一个庞大的用户基础,但参与度有限且似乎非常脆弱。主要的现有企业或多或少地匹配了你的技术,并正在利用他们的产品和分销优势来争夺市场。而且,看来很多价值和杠杆将来自于尚未发明的新体验,而你自己无法发明所有这些。你应该怎么做?
在过去的一年里,OpenAI 的回答似乎一直是“一切,立刻,昨天”。一个应用平台!不,另一个应用平台!一个浏览器!一个社交视频应用!乔尼·艾夫!医疗研究!广告!还有更多我忘记的东西!当然,还有数万亿美元的资本支出公告,或者至少是资本支出的雄心壮志。
其中一些看起来像是“全面出击”,或者是快速招聘了大量激进且野心勃勃的人的结果。有时人们也会模仿以前成功平台的形式,但并不完全理解其目的或动态:“平台有应用商店,所以我们需要一个应用商店!”
但在去年年底,山姆·奥特曼试图将这一切整合在一起,展示了这张图表,并引用了比尔·盖茨的名言,即平台的定义是它为合作伙伴创造的价值超过为自己创造的价值。
几乎在同一时间,首席财务官发布了这张图表。
公共公告:资本支出与收入之间的 1:1 关系并不是飞轮。
这是一个很好的、整洁的、连贯的战略。你的资本支出本身就是一种良性循环,并且它是建立一个全栈平台公司的基础。你从芯片和基础设施开始构建每一层堆栈,随着你向上推进堆栈,你越能帮助其他人使用你的工具来创建自己的东西。每个人都可以使用你的云服务、芯片、模型,然后进一步向上,堆栈的每一层都是相互促进的。你拥有网络效应,你有一个生态系统,你在整个堆栈中都有杠杆作用,每个人都基于你的东西进行构建,每个人都被锁定在这个系统中。其他人也可能构建部分堆栈,但你有一个可防御的、差异化的优势平台。
这确实是 Windows 或 iOS 的运作方式。问题是,我认为这并不是正确的类比。我认为 OpenAI 并不具备这种优势。它没有微软或苹果那样的平台和生态系统动态,而且那个飞轮图实际上并没有展示出飞轮。
让我们先谈谈资本支出。这就是让所有人都关注的原因,因为科技行业从未考虑过如此大的数字。四大云公司去年在基础设施上花费了约 4000 亿美元,并计划今年至少再投入 6500 亿美元。
正如我们所知,OpenAI 一直在努力加入这个俱乐部,几个月前声称未来将有 1.4 万亿美元和 30 吉瓦的计算能力承诺(没有时间表),而到 2025 年底报告称已使用 1.9 吉瓦。由于它没有来自现有业务的现金流规模,这些超大规模企业可以利用,因此它迄今为止通过筹集资金(并非所有资金都已关闭)和其他人的资产负债表(其中一些也是著名的“循环收入”)来实现这一点。
你可以观看许多长达三小时的播客讨论这一切,许多人对TPU、英伟达的产品领导地位以及甲骨文通过借贷来对抗衰退但仍有现金生成的遗留业务以进入新事物的策略发表意见,但我们其他人应该对此有多关心?这是通向竞争优势的道路,还是只是获得一个席位?
我们真的不知道人工智能基础设施的长期成本会是什么样子,但很有可能最终结果会像制造喷气式飞机或半导体一样:没有网络效应,但每一代产品都会变得更加困难和昂贵,因此这些行业已经从几十家公司发展到只有波音和空客以及台积电这两家公司。半导体制造业不仅有众所周知的摩尔定律,还有大多数人没听说过的洛克定律:摩尔定律指出芯片上的晶体管数量每两年翻一番,而洛克定律则指出最先进的半导体工厂的成本每四年翻一番。也许生成式人工智能也会这样,单位成本下降,但固定成本上升到只有少数几家公司能够维持建设竞争性模型所需的投入,其他公司都被挤出去。这种寡头垄断可能会有一个价格均衡点,尽管可能是高利润率或低利润率——这可能只是以边际成本出售的商品基础设施,特别是考虑到一些参与者将使用他们的模型来支持其他更具差异化的业务。问问你最喜欢的经济学家。
但是,再次强调,这是否意味着你能获得比在那张桌子上多一个座位?台积电不仅仅是一个寡头垄断者——它实际上在尖端芯片上拥有垄断地位——但这并没有给它在更高级别的堆栈中带来多少杠杆作用或价值捕获。人们开发了Windows应用程序、网络服务和iPhone应用程序——他们不会去开发台积电的应用程序或英特尔的应用程序。
开发者必须为Windows开发应用,因为几乎所有的用户都在使用Windows,而用户必须购买Windows PC,因为几乎所有的开发者都在为Windows开发应用(这是一种网络效应!)。但是,如果你利用生成式人工智能发明了一个出色的新应用,或者将其作为一个功能添加到现有产品中,你会调用运行在云端的基础模型的API,而用户并不知道或关心你使用的是哪个模型。使用Snap的人不会在意它是运行在AWS还是GCP上。当你购买一个企业级SaaS产品时,你也不会在意它是使用AWS还是Azure。如果我进行一次谷歌搜索,第一个匹配项是一个运行在谷歌云上的产品,我也永远不会知道。
这并不意味着这些API是可互换的——AWS、GCP和Azure之所以有非常不同的市场份额,以及开发者为何选择它们,是有很好的理由的。但客户并不知道也不在乎这一点。运行一个云并不会给你对更高级别堆栈中的第三方产品和服务的杠杆作用。
现在,或许不同之处在于所有这些服务都是独立的孤岛:在顶部,谷歌和Facebook有一个通用的搜索和发现层;在底部,云基础设施是通用的,但所有这些应用从未相互连接过。现在我们有了一个新兴的标准和协议的字母汤,用于模型和网站之间的跨广告、电子商务和某种意图与自动化通信(OpenClaw的短暂热情捕捉到了其中的一部分)。一个网站可以展示其功能,这样一部分功能可以直接出现在ChatGPT中,无论是房地产搜索还是购物车。你会告诉你的代理在Instagram上看一个食谱,并在Instacart上下单食材。一切都可以连接到其他一切,一切都能够互相交流!
同时,(大声说出这个悄悄话),如果你能设置和控制这些API并管理流量,这就赋予了你权力。标准一直是每一代技术的基本竞争武器——记得微软的口号“拥抱并扩展”。特别是,OpenAI建议你会使用你的ChatGPT账户作为将所有这些连接在一起的粘合剂。这就是一种网络效应!
我不确定这一点:我不确定这个愿景是否会真正实现,即使实现了,我也不确定它会给一家公司带来主导地位。
首先,在科技领域有一个常见的谬误,即你可以将许多不同的复杂产品抽象成一个简单的标准接口——你可以称之为“小部件谬论”。十年前,人们说“API是新的BD”,这实际上是同一个概念,而且大多数情况下都失败了。部分原因是演示中看起来很酷的东西与实际产品中的交互模型和工作流程之间存在巨大的差距:很快你就会遇到异常情况,需要实际的产品UI和人类决策。这也是因为激励机制不一致:没有人愿意成为别人的愚蠢API调用,因此抽象层可能带来的分发(Google Shopping、Facebook购物,现在是ChatGPT购物)和你控制体验及客户关系的愿望之间存在固有的紧张关系或权衡。记住,毕竟,Instacart的所有利润都来自展示广告。
当然,这只是推测——也许这次会成功!但第二个问题是,如果这些都是通过抽象和自动化的API拼接在一起的独立系统,用户或开发者会被锁定在任何一个系统中吗?如果聊天机器人流中的应用有效,而OpenAI使用一种标准,Gemini使用另一种标准,那么阻止开发者同时使用这两种标准的原因是什么?这比制作一个iOS和Android应用的代码少得多,而且无论如何,你不能让AI为你编写代码吗?这对开发者锁定有什么影响?同时,是的,也许我会用我的OpenAI或Gemini账户登录所有这些服务,但这是否意味着我应该用同一个账户登录Tinder、Zillow和Workday呢?并且,再次强调,他们是否希望这样?
嗯。
当我写这篇论文时,我反复回到了平台、生态系统、杠杆和网络效应这些术语。这些术语在科技领域经常被使用,但它们的意义相当模糊。谷歌云、苹果的应用商店、亚马逊市场,甚至TikTok都是“平台”,但它们都非常不同。
也许我真正寻找的词是权力。很久以前,当我还在大学的时候,我的中世纪历史教授罗杰·洛瓦特告诉我,权力就是能够让人们做他们不想做的事情的能力,而这正是问题所在。OpenAI是否有能力让消费者、开发者和企业使用它的系统超过其他人,不管系统本身实际上做了什么?微软、苹果和Facebook都有这种能力。亚马逊也有——这是一个真正的飞轮。

说到这一点,我认为解读比尔·盖茨那句话的一个好方法是,平台真正实现的是利用整个科技行业的创造性能量,这样你就不用自己发明一切,并且可以在大规模上建造更多的东西,但这一切都是在你的系统上完成的,你掌握着缰绳。LLM有这种能力吗?
基础模型无疑是倍增器:将会有很多新的东西通过它们构建出来。但是,你有什么理由让每个人都必须使用你的东西,即使你的竞争对手已经开发出了相同的东西?而且,无论竞争对手投入多少资金和努力,你是否有理由相信你的东西总是会比竞争对手更好?这是我们整个消费科技行业多年来一直运作的方式。如果不是这样,那么你唯一拥有的就是每天的执行力。比其他人执行得更好当然是一个目标,一些公司确实长期做到了这一点,并且甚至说服自己已经将这种能力制度化了,但这并不是一种策略。
_* 另一个比较是 ZIRP 中的“资本作为武器”阶段,当时公司利用廉价资本来购买规模,希望这能给他们带来市场主导地位,并通过网络效应使其具有防御性。这种方法至少可以说对 Uber 是有效的,但对 WeWork 却没有效果,就像 OpenAI 一样,它并没有网络效应。_
_** 还有一种可能是,这一切最终会完全不同,比如说,我们最终会有大量不同形状和大小的模型,其中一些可以在边缘免费运行,讨论人工智能基础设施的寡头垄断就像讨论 SQL 基础设施的寡头垄断一样合理。我们只是不知道结果会怎样。_
_*** 对此的反驳是,微软、谷歌、苹果和 Meta 可能生活在一个“赢家通吃”的世界中,但他们从未认为自己赢了。他们总是警惕着背后的情况。当然,这种心态的标志性表达是安迪·格罗夫的名言:“只有偏执者才能生存”。英特尔曾经拥有网络效应,后来又失去了;曾经拥有技术领先优势,后来也失去了。_