OpenAI在X上宣布：我们的新语音模型现已在实时API中可用

Q: GPT-Realtime-Translate

支持多语言实时翻译，打破语言障碍。

Q: GPT-Realtime-Whisper

可实时转录音频，适用于字幕和笔记生成。

OpenAI(@OpenAI)

OpenAI(@OpenAI)2026年5月7日

OpenAI在X上宣布：我们的新语音模型现已在实时API中可用

7.8Score

TL;DR · AI 摘要

OpenAI发布了三款新的语音模型：GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whisper，支持超过70种输入语言和13种输出语言的实时翻译。

核心要点

GPT-Realtime-2能够构建生产就绪的语音代理，处理复杂对话并保持流畅。
GPT-Realtime-Translate支持超过70种输入语言和13种输出语言的实时翻译。
GPT-Realtime-Whisper可以实时转录流媒体音频，生成字幕和笔记。

结构提纲

按章节快速跳转。

§新语音模型发布
OpenAI推出了三个新的语音模型，增强了语音智能的应用范围。
·GPT-Realtime-2
该模型用于创建能处理复杂对话的语音代理。
·GPT-Realtime-Translate
支持多语言实时翻译，打破语言障碍。
·GPT-Realtime-Whisper
可实时转录音频，适用于字幕和笔记生成。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

OpenAI 新语音模型
- GPT-Realtime-2
  - 生产就绪的语音代理
- GPT-Realtime-Translate
  - 多语言实时翻译
- GPT-Realtime-Whisper
  - 实时转录与字幕生成

金句 / Highlights

值得收藏与分享的关键句。

GPT-Realtime-Translate: 支持超过70种输入语言和13种输出语言的实时翻译。
⬇︎ 下载 PNG 𝕏 分享到 X
GPT-Realtime-2: 构建生产就绪的语音代理，处理复杂对话并保持流畅。
⬇︎ 下载 PNG 𝕏 分享到 X
GPT-Realtime-Whisper: 实时转录音频，生成字幕和笔记。
⬇︎ 下载 PNG 𝕏 分享到 X

#OpenAI#语音模型#实时API

打开原文

OpenAI on X： “我们的新语音模型现已在 Realtime API 中提供：🎙️ GPT-Realtime-2：构建可以更深入思考、采取行动、处理中断并保持对话流畅的生产就绪型语音代理。🎙️ GPT-Realtime-Translate：在超过 70 种语言之间进行流式传输时翻译” / X

不要错过正在发生的事情

OpenAI

@OpenAI

我们的新语音模型现已在 Realtime API 中提供： Image 5: 🎙️ GPT-Realtime-2：构建可以更深入思考、采取行动、处理中断并保持对话流畅的生产就绪型语音代理。 Image 6: 🎙️ GPT-Realtime-Translate：在超过 70 种输入和 13 种输出语言之间进行流式传输时翻译，打破语言障碍，帮助人们更自然地交流。 Image 7: 🎙️ GPT-Realtime-Whisper：实时生成字幕和笔记，将说出的话语音转录为文字。

![Image 8 使用 API 中的新模型推进语音智能](https://t.co/CLRyRfQmmf)

From openai.com

下午 5：19 · 2026 年 5 月 7 日

·

251.9K 次查看

37

184

1.6K

457

阅读 37 条回复