AI, networks and Mechanical Turks

TL;DR · AI 摘要
LLMs带来自动化理解'什么'和'为什么'的能力,改变了推荐系统的工作方式,但冷启动问题依然存在。
核心要点
- LLM能够理解用户行为背后的'为什么'。
- LLM可能通过API调用实现通用知识。
- 新的用户流程需要更智能地引导用户匹配推荐。
结构提纲
按章节快速跳转。
- §引言
介绍网络效应和冷启动问题。
讨论如何在没有用户的情况下提供推荐。
LLM能够理解用户行为背后的'为什么'。
LLM可能通过API调用实现通用知识。
新的用户流程需要更智能地引导用户匹配推荐。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- AI, networks and Mechanical Turks
金句 / Highlights
值得收藏与分享的关键句。
LLM是自动化理解'什么'和'为什么'的一步变化。
LLM可能通过API调用实现通用知识。
新的用户流程需要更智能地引导用户匹配推荐。
标题:AI、网络与机械土耳其人——本尼迪克·埃文斯
来源网址:https://www.ben-evans.com/benedictevans/2025/11/23/ai-networks-and-mechanical-turks
发布时间:2025-11-23T08:14:03-0500
Markdown 内容:
任何拥有大量用户的消费互联网系统,在某种程度上都变成了一个机械土耳其人。它会观察用户的行为并从中得出结论。亚马逊知道如果你购买了X,你可能会购买Y,因为它看到了很多人购买X后也购买了Y。谷歌的搜索主导地位部分基于人们搜索的内容、点击的内容以及接下来再次搜索的内容。
当然,这是一种网络效应,并且伴随着冷启动问题,这成为了一种进入壁垒。如何在没有用户的情况下提供那些推荐、建议和连接?又如何在无法做到这一点之前吸引用户?(这也是所有机器学习初创公司面临的问题。)
然而,这种做法的局限性在于,这些系统实际上并不真正了解你为什么观看那些内容、购买那些商品或查看那些东西,它们也不真正了解那些事物是什么。亚马逊有近十亿个SKU,但它只知道人类输入的元数据和一些购买相关性。Instagram或TikTok也有同样的问题。这些系统在SKU之间以及后续流程中存在相关性,但它们不知道原因,就像狗知道钥匙声与散步之间的高相关性,但并不知道钥匙是什么。
但是,LLM至少是一个自动化理解“什么”和“为什么”的飞跃。模型可以查看那些文字、图像、视频和产品及其所有元数据,并将其与具有某种理解力的模式联系起来,或者至少是更广泛的相关性。
因此,YouTube可以说:“你看汽车追逐视频。这里有一个看起来像是汽车追逐的视频”。但这也可以带来新的相关性(或者说,“理解”)。如今,亚马逊知道如果你买了打包胶带,你可能还需要气泡膜。它应该知道如果你买了这些东西,你可能还需要灯泡和烟雾探测器,因为你正在搬家。但LLM可能会向你展示家庭保险和宽带的广告,而这些是你从亚马逊的购买数据中无法推断出来的。
你不一定需要所有的用户基础来实现这一点——或者说,不需要你自己的用户基础,因为你可能不需要建立自己的机械土耳其人。如果这种知识足够普遍,它可能只是一个来自世界模型的API调用。你可以租用冷启动。就像亚马逊或TikTok通过观察人们在亚马逊和TikTok上的行为来构建推荐系统一样,这可能只是通用LLM的推理结果,任何人都可以将其插入到他们的产品中。你将“人类在循环”移动:现在,人类和机械土耳其人是在过去几百年中创建所有训练数据的过程中。你改变了杠杆点。
然而,冷启动问题的另一半是,亚马逊或TikTok需要看到你自己的行为,以便弄清楚哪些图可能适合。新用户流程需要尽可能轻松地向你提出足够的想法,并引导你完成足够的选择,以便开始做出匹配。Tinder通过一种极其简单的方式来改变约会行业,现在Tinder提出了另一种解决方法:让应用程序查看你的照片库,以了解你是什么样的人。
将这个问题推广开来,谷歌、亚马逊、Meta、TikTok、Tinder以及其他一些公司(如Uber、Doordash、Venmo)都对你有所了解。但它们各自只有一部分视角,就像盲人摸象的故事。理论上,你的手机拥有更广泛的视角,尽管苹果和谷歌对手机数据的使用非常谨慎(中国安卓OEM厂商在这方面更为激进),但手机的视角受限于不同的方式:你的手机可以知道你在亚马逊上购买了什么或在Instagram上看到了哪些图片,但它看不到导致Meta向你展示这些内容的图谱。现在,一个自主的LLM助手可能会以不同的方式成为另一个摸象的盲人:它知道不同的事情,但随着你使用它,它也会了解到关于你的不同信息,特别是在为你在亚马逊和Instacart购物、使用它的浏览器以及它的可穿戴设备时,它会得出新的结论。
我不知道这将如何运作,这些问题可能是错误的。目前的人工智能状态感觉像1997年的网络或2007年的移动互联网:我们知道这很重要,但我们不知道这一切将如何运作。
但我确实认为,这是一个我以前写过很多次的问题的新转折:互联网去除了旧的过滤器、策展和编辑,因此我们现在有了无限的产品、媒体和零售,却没有找到或看到我们不知道的东西的方法。互联网提供的过滤器非常不完美,而现在我们有了一个全新的、截然不同的过滤器。这似乎是一个比取代谷歌更大的问题。