Anthropic新模型Mythos Preview实现52倍AI代码加速，远超人类专家4倍上限

Anthropic(@AnthropicAI)

Anthropic(@AnthropicAI)2026年6月4日

Anthropic新模型Mythos Preview实现52倍AI代码加速，远超人类专家4倍上限

7.5Score

TL;DR · AI 摘要

Anthropic最新模型Mythos Preview在AI代码加速基准测试中实现52倍性能提升，远超人类专家4-8小时达成的4倍上限及前代Opus 4的3倍水平，标志着AI在算法优化领域已显著超越人类工程师效率。

核心要点

Mythos Preview将AI训练代码加速52倍，而人类专家耗时4-8小时仅能达到4倍加速。
相比2024年5月Claude Opus 4约3倍的平均加速，新模型性能提升超17倍。
该基准测试通过让模型优化小型AI训练代码来量化评估其算法改进能力。

结构提纲

按章节快速跳转。

§标准化AI代码加速基准测试
Anthropic每次发布新模型时均使用同一测试：要求模型优化小型AI训练代码以提升运行速度。
·人类专家的性能优化上限
熟练的人类工程师需要4至8小时才能将相同代码的运行速度提升至4倍。
›历代模型的加速性能对比
2024年5月的Claude Opus 4平均实现约3倍加速，而今年4月的Mythos Preview达到了约52倍加速。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

AI代码加速基准测试演进
- 测试方法论
  - 固定任务：优化小型AI训练代码
  - 人类基线：4-8小时达4倍加速
- 模型性能跃升
  - Claude Opus 4 (2024.05): ~3x
  - Mythos Preview (2026.04): ~52x

金句 / Highlights

值得收藏与分享的关键句。

熟练的人类工程师需要4至8小时才能将代码速度提升至4倍。
— 第1段
⬇︎ 下载 PNG 𝕏 分享到 X
2024年5月，Claude Opus 4平均实现了约3倍的加速。
— 第1段
⬇︎ 下载 PNG 𝕏 分享到 X
今年4月，Mythos Preview实现了约52倍的加速。
— 第1段
⬇︎ 下载 PNG 𝕏 分享到 X

#Anthropic#Mythos Preview#AI代码优化#性能基准测试

打开原文

Anthropic 在 X 上表示：“每次我们发布一个新模型时，都会进行相同的测试：给它一段用于训练小型 AI 模型的代码，并要求新模型对其进行加速。一名熟练的人类工程师需要 4-8 小时才能达到 4 倍的加速效果。

2024 年 5 月，Claude Opus 4 的平均加速比约为 3 倍。而在今年四月，Mythos Preview 实现了约 52 倍的加速。” / X

不要错过正在发生的事情

Anthropic

@AnthropicAI

每次我们发布一个新模型时，都会进行相同的测试：给它一段用于训练小型 AI 模型的代码，并要求新模型对其进行加速。一名熟练的人类工程师需要 4-8 小时才能达到 4 倍的加速效果。2024 年 5 月，Claude Opus 4 的平均加速比约为 3 倍。而在今年四月，Mythos Preview 实现了约 52 倍的加速。

下午 4:15 · 2026 年 6 月 4 日

·

60.78 万次查看

32

197

2,300

411

阅读 32 条回复