Greg Brockman(@gdb)
Codex 计算机使用体验令人震撼
5.5Score

TL;DR · AI 摘要
Greg Brockman指出Codex操控浏览器完成沙盒外任务时带来‘holy shit’级直观冲击;虽具强大表现力,但仍受限于工具链与安全边界,尚未实现通用自动化。
核心要点
- Codex通过调用浏览器工具实现真实世界交互,带来远超文本输出的沉浸感。
- 当前系统依赖人工编排,缺乏长期记忆与容错能力,尚不适用于生产级任务。
- 该演示验证了大模型在具身智能中的潜力,但需构建更鲁棒的工具抽象层。
结构提纲
按章节快速跳转。
Greg Brockman引用Nick Prince推文,强调Codex操控浏览器完成沙盒外任务时带来的‘holy shit’级直观冲击。
Codex通过调用如`browser.open`, `form.fill`, `screenshot`等工具,在真实浏览器环境中执行复杂交互任务。
模型在受限环境(如Jupyter或API)中无法完成的任务,可在浏览器中被成功执行,形成显著认知落差。
当前仍需人工干预编排流程,缺乏长期记忆与错误恢复能力;需构建更鲁棒的工具抽象层以支持通用自动化。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- Codex 计算机使用体验的震撼性
- 体验冲击来源
- 沙盒内 vs 沙盒外能力差异
- 真实世界交互替代纯文本输出
- 技术实现路径
- 浏览器控制工具链集成
- 多步骤任务编排
- 当前瓶颈
- 缺乏状态持久化
- 错误恢复机制薄弱
金句 / Highlights
值得收藏与分享的关键句。
watching codex control my browser to do things it can't do in the harness is a holy shit experience — Nick Prince
The visceral thrill comes from seeing an AI agent directly manipulate the real world (the browser) rather than just outputting text.
While powerful, this capability remains fragile: one misstep in tool usage or state management breaks the entire workflow.
#Codex#AI代理#浏览器自动化#OpenAI
打开原文格雷格·布罗克曼(Greg Brockman)在 X 上发文:“Codex 的计算机使用体验极具 visceral(直觉、本能)的吸引力。”
原文链接:https://x.com/gdb/status/2060978248792907818 发布时间:2026 年 6 月 1 日 02:53:55 GMT
Markdown 内容:
格雷格·布罗克曼  @gdb
Codex 的计算机使用体验极具 visceral(直觉、本能)的吸引力
引用内容:
尼克·普林斯

@Nick_Prince12 5 月 30 日
“看着 Codex 控制我的浏览器执行那些它在测试环境中无法完成的操作,这种体验简直令人震撼。”