Paul Couvert(@itsPaulAi)2026年5月22日

等等，Qwen-3.7-max 竟然能打败 GPT-5.5 和 Opus 4.7？！而且便宜得多

7.2Score

等等，Qwen-3.7-max 竟然能打败 GPT-5.5 和 Opus 4.7？！而且便宜得多

TL;DR · AI 摘要

Qwen-3.7-max 在实际代理任务中超越了 GPT-5.5 和 Opus 4.7，且成本显著更低。

核心要点

Qwen-3.7-max 在自进化 Tetris 机器人任务中击败 GPT-5.5 和 Opus 4.7。
该模型比 Opus 4.7 便宜 9 倍，比 GPT-5.5 便宜 2 倍。
测试任务包括代码读取、运行基准和自我迭代共 10 轮。

结构提纲

按章节快速跳转。

§模型表现对比
Qwen-3.7-max 在特定任务中优于 GPT-5.5 和 Opus 4.7。
·成本优势分析
Qwen-3.7-max 成本仅为 Opus 4.7 的九分之一，GPT-5.5 的二分之一。
·测试任务设计
测试任务为构建可自我进化的 Tetris 游戏机器人，持续十轮迭代。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

Qwen-3.7-max 性能突破
- 性能对比
  - 胜过 GPT-5.5
  - 胜过 Opus 4.7
- 成本优势
  - 比 Opus 4.7 便宜 9x
  - 比 GPT-5.5 便宜 2x

金句 / Highlights

值得收藏与分享的关键句。

Qwen-3.7-max 竟能同时击败 GPT-5.5 和 Opus 4.7？而且便宜得多。
— 推文正文
⬇︎ 下载 PNG 𝕏 分享到 X
比 Opus 4.7 便宜 9 倍，比 GPT-5.5 便宜 2 倍。
— 推文正文
⬇︎ 下载 PNG 𝕏 分享到 X
每个模型都能读自己的代码、运行基准并在 10 次迭代中重写自己。
— 回复内容
⬇︎ 下载 PNG 𝕏 分享到 X

#Qwen#GPT#AI模型#性能评测#成本效益

Paul Couvert 在 X 上说："等等，所以 Qwen-3.7-max 能同时击败 GPT-5.5 和 Opus 4.7？！

而且价格要便宜得多：

比 Opus 4.7 便宜 9 倍
比 GPT-5.5 便宜 2 倍

非常令人印象深刻，说实话没想到。" / X

不要错过正在发生的事情

等等，所以 Qwen-3.7-max 能同时击败 GPT-5.5 和 Opus 4.7？！而且价格要便宜得多：

比 Opus 4.7 便宜 9 倍
比 GPT-5.5 便宜 2 倍

非常令人印象深刻，说实话没想到。

引用

@atomic_chat_hq

·

5月21日

Qwen 3.7-max 击败了 Opus 4.7 和 GPT-5.5 我们在一个真实的智能体任务上测试了三个前沿模型：编写一个俄罗斯方块机器人，让它自己玩游戏并自我训练。每个模型都可以阅读自己的代码、运行基准测试，并在 10 次迭代中重写自身。然后我们比较了最终的机器人

[视频 2](blob:https://x.com/c7d22c41-34e3-4fbf-88c2-323ab0fc2558)

0:10

上午 10:17 · 2026年5月22日

·

11.7K 次观看

11

6

63

21

阅读 11 条回复