T
traeai
登录
返回首页
OpenAI(@OpenAI)

OpenAI在X上宣布:我们的新语音模型现已在实时API中可用

7.8Score
OpenAI在X上宣布:我们的新语音模型现已在实时API中可用

TL;DR · AI 摘要

OpenAI发布了三款新的语音模型:GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whisper,支持超过70种输入语言和13种输出语言的实时翻译。

核心要点

  • GPT-Realtime-2能够构建生产就绪的语音代理,处理复杂对话并保持流畅。
  • GPT-Realtime-Translate支持超过70种输入语言和13种输出语言的实时翻译。
  • GPT-Realtime-Whisper可以实时转录流媒体音频,生成字幕和笔记。

结构提纲

按章节快速跳转。

  1. OpenAI推出了三个新的语音模型,增强了语音智能的应用范围。

  2. 该模型用于创建能处理复杂对话的语音代理。

  3. 支持多语言实时翻译,打破语言障碍。

  4. 可实时转录音频,适用于字幕和笔记生成。

思维导图

用一张图看清主题之间的关系。

查看大纲文本(无障碍 / 无 JS 友好)
  • OpenAI 新语音模型
    • GPT-Realtime-2
      • 生产就绪的语音代理
    • GPT-Realtime-Translate
      • 多语言实时翻译
    • GPT-Realtime-Whisper
      • 实时转录与字幕生成

金句 / Highlights

值得收藏与分享的关键句。

#OpenAI#语音模型#实时API
打开原文

OpenAI on X: “我们的新语音模型现已在 Realtime API 中提供:🎙️ GPT-Realtime-2: 构建可以更深入思考、采取行动、处理中断并保持对话流畅的生产就绪型语音代理。🎙️ GPT-Realtime-Translate: 在超过 70 种语言之间进行流式传输时翻译” / X

不要错过正在发生的事情

Image 4: Square profile picture

OpenAI

@OpenAI

我们的新语音模型现已在 Realtime API 中提供:Image 5: 🎙️ GPT-Realtime-2: 构建可以更深入思考、采取行动、处理中断并保持对话流畅的生产就绪型语音代理。Image 6: 🎙️ GPT-Realtime-Translate: 在超过 70 种输入和 13 种输出语言之间进行流式传输时翻译,打破语言障碍,帮助人们更自然地交流。Image 7: 🎙️ GPT-Realtime-Whisper: 实时生成字幕和笔记,将说出的话语音转录为文字。

![Image 8 使用 API 中的新模型推进语音智能](https://t.co/CLRyRfQmmf)

From openai.com

下午 5:19 · 2026 年 5 月 7 日

·

251.9K 次查看

37

184

1.6K

457

阅读 37 条回复

AI 可能会生成不准确的信息,请核实重要内容