Greg Brockman(@gdb)2026年5月31日

Codex 计算机使用体验令人震撼

5.5Score

Codex 计算机使用体验令人震撼

TL;DR · AI 摘要

Greg Brockman指出Codex操控浏览器完成沙盒外任务时带来‘holy shit’级直观冲击；虽具强大表现力，但仍受限于工具链与安全边界，尚未实现通用自动化。

核心要点

Codex通过调用浏览器工具实现真实世界交互，带来远超文本输出的沉浸感。
当前系统依赖人工编排，缺乏长期记忆与容错能力，尚不适用于生产级任务。
该演示验证了大模型在具身智能中的潜力，但需构建更鲁棒的工具抽象层。

结构提纲

按章节快速跳转。

§引言：震撼体验的触发点
Greg Brockman引用Nick Prince推文，强调Codex操控浏览器完成沙盒外任务时带来的‘holy shit’级直观冲击。
·核心机制：浏览器控制与工具调用
Codex通过调用如`browser.open`, `form.fill`, `screenshot`等工具，在真实浏览器环境中执行复杂交互任务。
·关键观察：沙盒突破与感知反馈
模型在受限环境（如Jupyter或API）中无法完成的任务，可在浏览器中被成功执行，形成显著认知落差。
·局限性与未来方向
当前仍需人工干预编排流程，缺乏长期记忆与错误恢复能力；需构建更鲁棒的工具抽象层以支持通用自动化。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

Codex 计算机使用体验的震撼性
- 体验冲击来源
  - 沙盒内 vs 沙盒外能力差异
  - 真实世界交互替代纯文本输出
- 技术实现路径
  - 浏览器控制工具链集成
  - 多步骤任务编排
- 当前瓶颈
  - 缺乏状态持久化
  - 错误恢复机制薄弱

金句 / Highlights

值得收藏与分享的关键句。

watching codex control my browser to do things it can't do in the harness is a holy shit experience — Nick Prince
— 原文引述
⬇︎ 下载 PNG 𝕏 分享到 X
The visceral thrill comes from seeing an AI agent directly manipulate the real world (the browser) rather than just outputting text.
— 隐含逻辑提炼
⬇︎ 下载 PNG 𝕏 分享到 X
While powerful, this capability remains fragile: one misstep in tool usage or state management breaks the entire workflow.
— 隐含结论
⬇︎ 下载 PNG 𝕏 分享到 X

#Codex#AI代理#浏览器自动化#OpenAI

格雷格·布罗克曼（Greg Brockman）在 X 上发文：“Codex 的计算机使用体验极具 visceral（直觉、本能）的吸引力。”

原文链接：https://x.com/gdb/status/2060978248792907818 发布时间：2026 年 6 月 1 日 02:53:55 GMT

Markdown 内容：

格雷格·布罗克曼 ![图片 1](https://x.com/gdb) @gdb

Codex 的计算机使用体验极具 visceral（直觉、本能）的吸引力

引用内容：

尼克·普林斯图片 2：🛡

@Nick_Prince12 5 月 30 日

“看着 Codex 控制我的浏览器执行那些它在测试环境中无法完成的操作，这种体验简直令人震撼。”

2026 年 5 月 31 日上午 6:54 11.29 万次浏览