通过 API 中的新模型推进语音智能
OpenAI 推出三款实时语音模型,提升语音应用的智能化水平。
入选理由:GPT-Realtime-2 能处理复杂请求并自然延续对话。
模型
OpenAI 推出的实时语音翻译模型。
已跟踪 8 条高相关材料
最近变化
2026-05-29 · GPT-Realtime-Translate 是 OpenAI 的新模型,可将语音输入实时翻译为指定目标语言。
为什么值得关注
GPT-Realtime-Translate 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。
Advancing voice intelligence with new models in the API
OpenAI Blog · 9.2 分
OpenAI 推出三款实时语音模型,提升语音应用的智能化水平。
OpenAI 在 Realtime API 里上线了三款新语音模型:GPT-Realtime-2、GPT-Realtime-Translate 和 GPT-Realtime-Whisper,分别管对话...
宝玉(@dotey) · 8.9 分
OpenAI发布了三款新语音模型:GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whisper,显著提升了对话、翻译和实时转录能力。
Interaction Models
Hacker News Best · 8.7 分
交互模型(Interaction Models)通过原生支持多模态实时交互,突破传统单线程对话的瓶颈,使AI能像人类协作一样持续感知、响应和行动,显著提升人机协同效率。该技术在智能与响应性上达到行业领先水平。
已收录 8 条与 GPT-Realtime-Translate 相关的内容,按评分排序。
OpenAI 推出三款实时语音模型,提升语音应用的智能化水平。
入选理由:GPT-Realtime-2 能处理复杂请求并自然延续对话。
OpenAI发布了三款新语音模型:GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whisper,显著提升了对话、翻译和实时转录能力。
入选理由:GPT-Realtime-2在Big Bench Audio智能测试上从81.4%提升到96.6%,支持更复杂的任务编排。
交互模型通过原生支持多模态实时交互,突破传统单线程对话瓶颈,显著提升人机协同效率。
入选理由:采用多流微轮次设计,实现跨音频、视频、文本的实时交互响应。
OpenAI推出了两款新的实时音频模型:GPT Realtime Translate支持70种语言的实时翻译,GPT Realtime 2则增强了语音助手的理解和执行能力。
入选理由:GPT Realtime Translate能够实现实时跨70种语言的翻译。
OpenAI 推出实时翻译模型 GPT-Realtime-Translate,支持 70+ 输入语言和 13 种输出语言,专为智能眼镜等设备优化。
入选理由:GPT-Realtime-Translate 是 OpenAI 的新模型,可将语音输入实时翻译为指定目标语言。
OpenAI发布了三款新的语音模型:GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whisper,支持超过70种输入语言和13种输出语言的实时翻译。
入选理由:GPT-Realtime-2能够构建生产就绪的语音代理,处理复杂对话并保持流畅。
GPT-Realtime-Translate 实现了实时语音翻译,支持超过 70 种输入语言和 13 种输出语言。
入选理由:GPT-Realtime-Translate 支持 70 多种输入语言和 13 种输出语言。
OpenAI发布了GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whisper,现已在实时API中可用。
入选理由:GPT-Realtime-2提升了实时处理能力。