🔬Doing Vibe Physics — Alex Lupsasca, OpenAI

TL;DR · AI 摘要
OpenAI科学家Alex Lupsasca通过实践证明,GPT-5系列模型已在理论物理前沿实现突破性辅助科研能力,能复现其耗时数月的论文成果于11分钟内,标志着AI正重塑基础科学推理范式。
核心要点
- GPT-5可复现理论物理学家耗时数月的顶尖论文成果,仅需11分钟,远超日常工具提升。
- AI在科学前沿的突破常被公众忽视,因主流关注点仍在邮件/代码等低阶任务。
- 通过提示工程(priming)激活模型深层推理能力,是AI辅助科学发现的关键实践方法。
结构提纲
按章节快速跳转。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- AI重塑理论物理推理
- 关键人物
- Alex Lupsasca
- Mark Chen (OpenAI CRO)
- 核心技术
- GPT-5 / GPT-5.2
- 提示工程(priming)
- 突破成果
- 复现作者核心论文
- 推导新胶子振幅
金句 / Highlights
值得收藏与分享的关键句。
当GPT-5发布时,Twitter上很多人说它没提升邮件写作——但科学前沿的能力正在爆炸式增长。
GPT-5能在11分钟内复现我花了数月才完成的论文——这改变了我对科研工具的所有认知。
我们不是在用AI写代码,而是在用它进行理论物理推理——它正在成为新的思维伙伴。
提示工程不是技巧,是新科学方法论:用教科书问题唤醒模型的深层物理直觉。
AI首次推导出被学界认为不可能的胶子振幅——这标志着机器开始产生原创科学洞见。
标题:🔬做振动物理——亚历克斯·卢普萨斯卡,OpenAI
来源链接:http://www.latent.space/p/lupsasca
发布日期:2026-05-05T20:34:11+00:00
Markdown 内容:
有些人对 GPT 5.5 疯狂着迷。_某些_人。这是关于 JaggedFrontier 的故事。那些用 AI 写邮件或甚至写代码实现的人觉得提升有限,而那些在模型极限边缘探索的人却发现,极限本身已经向外扩展了。
亚历克斯·卢普萨斯卡 已经追踪这一极限一年半之久。“当 GPT-5 发布时,它能在 30 分钟内复现我一篇最出色的论文(那篇论文我花了很长时间才完成)。”
但亚历克斯也指出,这种转变几乎悄无声息。
我记得 GPT-5 发布时……在 Twitter 上,反响平平。很多人说:“我们期待更多,它写邮件也没更好。” 我当时就想:好吧,GPT-3 本来就能写邮件,它在写邮件上还能好到哪儿去?那根本不是重点。但在科学前沿,能力却真正开始爆发。
今天我们与他一起深入探讨了他的论文及其他内容!点击观看。
亚历克斯在职业生涯早期就因在黑洞理解上的突破而崭露头角。他还因 黑洞探索者 和一款让普通观众能以趣味互动方式可视化黑洞的 iPhone 应用 而闻名。亚历克斯荣获 2024 年“基础物理学突破奖·新视野奖”。该奖项被誉为“物理学界的奥斯卡”,可能是早期理论物理学家所能获得的最负盛名的奖项。1
亚历克斯首次在理论物理中看到 AI 的潜力,是在他向 o3 寻求研究帮助之后。在播客中,亚历克斯回忆道,他曾向 GPT 寻求一个原本需要数日才能完成的计算,结果仅用 11 分钟就得到了答案。
尽管他的物理学家同事和更广泛的学术界对此反应冷淡或持怀疑态度,他却立刻意识到 AI 对其工作的巨大影响。
当时 GPT-5 刚刚发布,亚历克斯尝试让它解决一篇刚发表论文中的问题。GPT-5 回答“无解”。但 OpenAI 首席研究官马克·陈 更进一步,让亚历克斯先用一本教科书中的热身题引导模型,模型轻松解决了它2。在使用这种“引导”技巧后,GPT-5 在 11 分钟内复现了他完整的推导结果(是的,这篇论文是在模型训练截止后才发布的)。
“这改变了所有事情。”亚历克斯指出,我们似乎正站在理论物理推理发生巨大变革的边缘。一年前,大语言模型才刚开始能正确做数学;如今,ChatGPT 已能在你喝杯咖啡的时间内复现他最难的论文。
亚历克斯当时正在范德堡大学休假,随后加入 OpenAI,开始推动 AI 加速物理学研究的边界。

亚历克斯开始测试 GPT 的极限,向同事征集他们卡住的问题。他昔日的博士导师(哈佛大学的安德鲁·斯特罗明格教授)曾对一类被称为“单负胶子树振幅”的物理量有过一个洞见。

在某些情况下,这些振幅可能非零,而此前已被证明总是为零3。团队将这一直觉向前推进,提出了一种公式,该公式看似非零,但此前完全无法求解。

这篇论文中的一个关键方程占了四分之一页,包含 32 项之和,每项又是四个因子的乘积,每个因子都编码了一个复杂的公式。仅靠人工计算,就已是论文第一作者的浩大工程!
亚历克斯花了一年多时间,却毫无进展。
斯特罗明格教授原计划在初次对话后的一周内访问 OpenAI 共同攻关此问题。而就在那一周内,ChatGPT 完全解决了这个问题——正如亚历克斯回忆的那样,在斯特罗明格教授的飞机落地之前。
有趣之处不仅在于 ChatGPT 解决了这个问题,更在于它是如何解决的。模型迅速识别出一个极限情形(称为“半共线区域”),事后回看,这一情形具有直观的解释4。取此极限后,原本复杂的表达式简化为一个简洁而直观的公式!
最后一步是证明这个直观公式。团队开启全新对话,提供此前已获得的上下文提示,然后放手让模型自行发挥。ChatGPT 不仅复现了先前结果,还用一种作者从未知晓的技术完成了证明!
有了这一具体成果,团队开始尝试:能否用 ChatGPT 从零生成全新的物理?他们选择了一个他们认为更难的问题——研究引力子,一种在引力与量子力学结合时应出现的假想粒子。5 他们写下一个简单提示,要求 ChatGPT 像处理胶子论文那样,对引力子做同样的研究,然后按下回车!
接下来发生的一切堪称真正的“振动物理”:ChatGPT 在一天之内输出了 110 页全新的物理成果、新计算和新方法。整个过程遵循着任何使用过编码代理的人都熟悉的模式:
GPT:这是你的<长而详尽、精彩绝伦的结果>。
要不要我再做<另一个超酷的事情>?
亚历克斯:当然要!
GPT:<完成那个超酷的事情>对深入观察者而言,这远非胶子与引力子之间的直接一一映射。ChatGPT 引入了因引力子本质而必需的新技术,并完美运用了它们。
团队随后花了三周时间验证所有结果。结果出炉!一篇新论文诞生了,其中包含全新的量子引力成果,总耗时不到三天。这真是一个“感受 AGI 的时刻”。

感兴趣者可阅读一篇博客文章,其中包含从初始提示到最终论文的完整对话记录。即使你不懂物理,看到仅凭“先在 SD 外计算,这是第一步”这类简单提示,就能源源不断输出正确计算的页面,也足以令人震惊。
“振动物理”与“振动编程”在本质上的区别在于:振动物理意味着真正拓展人类知识的前沿。回顾胶子与引力子的结果,它们在事后看来,如同许多物理与数学成果一样,仿佛是我们已知知识的自然延伸——而这恰恰是它们如此优美的原因。但这个难题曾让领域专家束手无策长达一年之久。尽管仍带有一些重组的色彩,但这件事此前从未有人做过。
或许仍存在大量 AI 无法胜任的问题,或 AI 根本想不到的思路——这正是人们一直在谈论的“直觉”。亚历克斯告诉我们,这些能力使他能够探索众多可能性,从而规划出更雄心勃勃的研究方向。当 AI 输出结果的速度几乎与我们构思和验证的速度持平,一位理论物理学家所能企及的疆域,已变得无比广阔。
在为本播客做研究时,我们曾问 AI 是否如此,它建议了 IUPAP 奖项——结果发现,亚历克斯在 2024 年也赢得了该奖。
这是一个有趣的提示技巧:通过解决一个更简单但相关的题目,引导模型走上正确的思路。
严格来说,原始结论在“3+1 维时空”(即我们现实所处的时空)中依然成立。这里的洞见在于:如果我们拥有两个时间维度和两个空间维度,数学上会发生某种“魔法”,从而打破原有假设。拥有两个时间维度和两个空间维度意味着什么?这是一个有趣的讨论,可惜我们没时间展开。
对专家而言,这相当于一个粒子衰变为 n-1 个其他粒子。
关于这个粒子已有大量文献,远比本博客更权威。此处唯一相关的是:引力子是胶子在引力中的类比,且螺旋度概念更复杂,但仍可定义与胶子论文相类比的有意义概念。