Paul Couvert(@itsPaulAi)
等等,Qwen-3.7-max 竟然能打败 GPT-5.5 和 Opus 4.7?!而且便宜得多
7.2Score

TL;DR · AI 摘要
Qwen-3.7-max 在实际代理任务中超越了 GPT-5.5 和 Opus 4.7,且成本显著更低。
核心要点
- Qwen-3.7-max 在自进化 Tetris 机器人任务中击败 GPT-5.5 和 Opus 4.7。
- 该模型比 Opus 4.7 便宜 9 倍,比 GPT-5.5 便宜 2 倍。
- 测试任务包括代码读取、运行基准和自我迭代共 10 轮。
结构提纲
按章节快速跳转。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- Qwen-3.7-max 性能突破
- 性能对比
- 胜过 GPT-5.5
- 胜过 Opus 4.7
- 成本优势
- 比 Opus 4.7 便宜 9x
- 比 GPT-5.5 便宜 2x
金句 / Highlights
值得收藏与分享的关键句。
Qwen-3.7-max 竟能同时击败 GPT-5.5 和 Opus 4.7?而且便宜得多。
比 Opus 4.7 便宜 9 倍,比 GPT-5.5 便宜 2 倍。
每个模型都能读自己的代码、运行基准并在 10 次迭代中重写自己。
#Qwen#GPT#AI模型#性能评测#成本效益
打开原文Paul Couvert 在 X 上说:"等等,所以 Qwen-3.7-max 能同时击败 GPT-5.5 和 Opus 4.7?!
而且价格要便宜得多:
- 比 Opus 4.7 便宜 9 倍
- 比 GPT-5.5 便宜 2 倍
非常令人印象深刻,说实话没想到。" / X
不要错过正在发生的事情

等等,所以 Qwen-3.7-max 能同时击败 GPT-5.5 和 Opus 4.7?!而且价格要便宜得多:
- 比 Opus 4.7 便宜 9 倍
- 比 GPT-5.5 便宜 2 倍
非常令人印象深刻,说实话没想到。
引用

@atomic_chat_hq
·
5月21日
Qwen 3.7-max 击败了 Opus 4.7 和 GPT-5.5 我们在一个真实的智能体任务上测试了三个前沿模型:编写一个俄罗斯方块机器人,让它自己玩游戏并自我训练。每个模型都可以阅读自己的代码、运行基准测试,并在 10 次迭代中重写自身。然后我们比较了最终的机器人
[视频 2](blob:https://x.com/c7d22c41-34e3-4fbf-88c2-323ab0fc2558)
0:10
·
11
6
63
21
阅读 11 条回复