微软发布MAI系列模型：Thinking-1推理能力对标Opus 4.6，Transcribe-1.5转录速度提升5倍

Mustafa Suleyman(@mustafasuleyman)

Mustafa Suleyman(@mustafasuleyman)2026年6月4日

微软发布MAI系列模型：Thinking-1推理能力对标Opus 4.6，Transcribe-1.5转录速度提升5倍

8.5Score

TL;DR · AI 摘要

微软发布MAI-Thinking-1等7款模型，其中推理模型SWE-Bench Pro达53%媲美Opus 4.6，转录模型MAI-Transcribe-1.5支持43种语言且速度提升5倍。

核心要点

MAI-Thinking-1在SWE-Bench Pro得分53%，与Opus 4.6并列顶尖编码推理水平。
MAI-Transcribe-1.5支持43种语言SOTA精度，推理速度比竞品快5倍。
MAI-Code-1-Flash仅5B激活参数，SWE-Bench Pro达51%，专为VS Code优化。

结构提纲

按章节快速跳转。

§MAI-Thinking-1推理性能
MAI-Thinking-1在SWE-Bench Pro上达到53%，在编码推理基准测试中与Opus 4.6持平。
·技术报告发布
一份109页的技术报告详细阐述了MAI-Thinking-1的训练方法及经验教训。
§MAI-Transcribe-1.5能力
MAI-Transcribe-1.5在43种语言上实现SOTA精度，推理速度比竞争对手快5倍。
·高效编码模型
MAI-Code-1-Flash仅使用5B激活参数即在SWE-Bench Pro上达到51%，专为VS Code集成优化。
§语音与图像生成更新
新语音模型支持15种语言的情感控制，图像模型在编辑排行榜上超越Nano Banana 2。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

Microsoft MAI Model Family
- Reasoning & Code
  - MAI-Thinking-1 (53% SWE-Bench)
  - MAI-Code-1-Flash (5B Params)
- Speech & Audio
  - MAI-Transcribe-1.5 (43 Langs)
  - MAI-Voice-2 (Emotional Control)
- Vision
  - MAI-Image-2.5 (H100 Optimized)

金句 / Highlights

值得收藏与分享的关键句。

MAI-Thinking-1在SWE-Bench Pro上达到53%，在最难的编码基准测试中与Opus 4.6并驾齐驱。
— 第1段
⬇︎ 下载 PNG 𝕏 分享到 X
MAI-Transcribe-1.5在43种语言上提供SOTA精度，速度比竞品快5倍。
— 第1段
⬇︎ 下载 PNG 𝕏 分享到 X
MAI-Code-1-Flash仅5B激活参数，却在SWE-Bench Pro上交付51%的成绩。
— 第1段
⬇︎ 下载 PNG 𝕏 分享到 X
通往前沿没有捷径；纪律、耐心和一丝不苟的细节关注至关重要。
— 第1段
⬇︎ 下载 PNG 𝕏 分享到 X

#MAI-Thinking-1#SWE-Bench#Microsoft AI#多模态模型

打开原文

标题：Mustafa Suleyman 在 X 上表示：“通往技术前沿没有捷径。严谨、耐心以及对细节的一丝不苟至关重要。为了让大家深入了解我们的进展，我们发布了一份非常详尽的技术报告（长达 109 页！），详细介绍了我们如何训练 MAI-Thinking-1 以及在此过程中的收获 https://t.co/468wkWmiIZ” / X

URL 来源：https://x.com/mustafasuleyman/status/2062609054405447785

Markdown 内容：

通往技术前沿没有捷径。严谨、耐心以及对细节的一丝不苟至关重要。为了让大家深入了解我们的进展，我们发布了一份非常详尽的技术报告（长达 109 页！），详细介绍了我们如何训练 MAI-Thinking-1 以及在此过程中的收获。microsoft.ai/wp-content/upl 该模型在推理和 SWE 基准测试中表现极为出色。令我倍感自豪的是，它在 SWE-Bench Pro 上达到了 53% 的准确率，在这一最严苛的代码基准测试中与 Opus 4.6 并驾齐驱。随着我们将该模型投入生产环境并应用于更多实际场景，我们还有大量工作要做。此外，我们还推出了另外六个世界级模型。阵容如下：microsoft.ai - MAI-Transcribe-1.5 是全球最佳的转录模型，在 43 种语言中均实现了 SOTA 级准确率，超越了 Gemini 和 OpenAI 的旗舰转录模型。它不仅准确率最高，速度更是竞品的 5 倍。该模型现已登陆 Microsoft Foundry，成为所有超大规模云服务商中速度最快、效率最高且最具成本效益的转录模型。- MAI-Voice-2 是我们最新的语音生成模型，发音自然地道，并支持精细的情感控制，目前支持 15 种语言，更多语言即将上线。而 MAI-Voice-2-Flash 则为对延迟极度敏感的语音智能体提供了最佳的性价比和响应速度。- MAI-Code-1-Flash 是我们全新的高效推理代码模型，专为 VS Code 和 GitHub Copilot CLI 优化调优。作为一个仅拥有 50 亿激活参数的模型，它既聪明又迅捷，在 SWE-Bench Pro 上取得了 51% 的成绩。我们非常期待将其投入生产，并在更多真实世界任务中不断攀升。- MAI-Image-2.5 及其 Flash 版本是两款性能极强的模型，带来了图像质量的跨越式提升，并在图像编辑排行榜上超越了 Nano Banana 2。MAI-Image-2.5 在 H100 上展现出卓越性能，可在现有基础设施上部署，并能灵活扩展至 GB200/GB300 系统。我们正在招贤纳士！我们是一个精干高效、行动迅速的实验室，汇聚了全球顶尖的人才。加入我们，共同研发下一代模型吧！