Greg Brockman(@gdb)
GPT 实时 2.0 解锁了一些真正的魔法:
5.5Score

TL;DR · AI 摘要
GPT Realtime 2.0 是 OpenAI 推出的语音操作系统原型,可仅凭语音控制电脑,但尚处实验阶段;其价值在于验证语音即界面的可行性,而非成熟产品。
核心要点
- GPT Realtime 2.0 支持仅用语音完成系统级操作,如‘打开 Chrome’‘写 React 组件’等指令
- 该演示由 Greg Brockman(前 OpenAI CTO)发布,视频截至 2026 年 5 月 31 日已获 29.3 万次观看
- 当前为实验性原型,未公开 API/SDK,仅限内部或受邀演示
结构提纲
按章节快速跳转。
Greg Brockman 在 X 上发布 GPT Realtime 2.0 演示视频,强调其‘真正魔法’在于无需手部操作即可控制电脑。
视频中演示了仅靠语音命令实现系统级操作:如启动浏览器、编写 React 组件、执行终端命令等。
该系统为实验性原型,尚未正式发布;OpenAI 未提供 API/SDK,仅用于内部或邀请制演示。
验证了端到端语音→动作闭环可行性,但离量产部署仍有距离;当前主要价值在于方向性信号而非可用工具。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- GPT Realtime 2.0 语音操作系统原型
- 核心能力
- 语音驱动系统操作
- 多模态指令解析(如‘写 React 组件’)
- 当前状态
- 实验性原型
- 未公开发布
- 行业影响
- 验证语音作为新输入范式
- 推动人机交互范式演进
金句 / Highlights
值得收藏与分享的关键句。
‘Watch me control my computer with just my voice. This is the future of operating systems.’ —— Greg Brockman 强调语音即界面的愿景。
Demo 中包含‘open chrome’‘write a react component that renders a button’等具体指令,体现语义理解与执行能力。
截至 2026 年 5 月 31 日,该推文已获得 293.3K 观看,说明社区对语音 OS 的高度关注。
#GPT#语音交互#OpenAI#操作系统
打开原文Greg Brockman 在 X 上发布:“GPT 实时 2 版本解锁了一些真正的魔法:”
Greg Brockman 
GPT Realtime 2 版本解锁了一些真正的魔法:
@FarzaTV
5 月 30 日
看我仅凭语音就能操控我的电脑。这便是操作系统的未来——无需动手。GPT-Realtime 2.0 非常、非常被低估了。演示视频如下: