Qwen3.7-Max 未开源权重，但对企业代理仍具高性价比

Milvus(@milvusio)

Milvus(@milvusio)2026年5月23日

Qwen3.7-Max 未开源权重，但对企业代理仍具高性价比

7.5Score

TL;DR · AI 摘要

Qwen3.7-Max未开源权重，但因其在企业代理场景下的高性价比和优异性能表现，成为值得关注的模型。

核心要点

Qwen3.7-Max在Terminal-Bench 2.0得分为69.7，SWE-Pro为60.6，SWE-Verified为80.4。
该模型支持35小时自主编码运行，共调用1158次工具，适用于复杂代理任务。
相比Claude Sonnet，其定价更优：输入$1.7/M token，输出$5/M token，降低代理成本。

结构提纲

按章节快速跳转。

§Qwen3.7-Max 发布背景
Qwen3.7-Max未开放权重，但因其在企业代理中的价值而受到关注。
·性能指标分析
模型在多个基准测试中表现优异，尤其适合代理工作流。
›自主编码能力展示
模型支持长达35小时的自主编码任务，调用1158次工具。
·价格优势对比
相较于Claude Sonnet，Qwen3.7-Max在输入输出定价上更具竞争力。
›Milvus 的协同作用
Milvus 提供检索与记忆层，优化代理上下文处理效率。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

Qwen3.7-Max 企业代理应用
- 性能表现
  - Terminal-Bench 2.0: 69.7
  - SWE-Pro: 60.6
  - SWE-Verified: 80.4
- 成本效益
  - 输入定价: $1.7/M token
  - 输出定价: $5/M token
  - 对比 Claude Sonnet
- Milvus 协同
  - 向量数据库支持
  - 减少无效上下文传输
  - 提升执行效率

金句 / Highlights

值得收藏与分享的关键句。

Qwen3.7-Max在Terminal-Bench 2.0得分为69.7，在SWE-Pro为60.6，在SWE-Verified为80.4。
— 第 1 段
⬇︎ 下载 PNG 𝕏 分享到 X
该模型支持35小时自主编码运行，共调用1158次工具，适用于复杂代理任务。
— 第 1 段
⬇︎ 下载 PNG 𝕏 分享到 X
Qwen3.7-Max定价为$1.7/M token输入和$5/M token输出，优于Claude Sonnet的$3/$15。
— 第 1 段
⬇︎ 下载 PNG 𝕏 分享到 X

#Qwen#Milvus#Agent#Vector Database#LLM

打开原文

Milvus 在 X 上发布：“这次，Qwen3.7-Max 并未以开放权重形式发布。但对于企业代理模型来说，它仍然是最值得关注的高性价比模型之一。该模型显然针对代理工作流设计：在 Terminal-Bench 2.0 上得分为 69.7，在 SWE-Pro 上得分为 60.6，在 SWE-Verified 上得分为 80.4，此外还有一项报道中的 35 小时自主编码运行，包含 1,158 次工具调用。” / X

不要错过正在发生的事情

Milvus

@milvusio

这次，Qwen3.7-Max 并未以开放权重形式发布。但对于企业代理模型来说，它仍然是最值得关注的高性价比模型之一。该模型显然针对代理工作流设计：在 Terminal-Bench 2.0 上得分为 69.7，在 SWE-Pro 上得分为 60.6，在 SWE-Verified 上得分为 80.4，此外还有一项报道中的 35 小时自主编码运行，包含 1,158 次工具调用。定价也颇具竞争力：每百万输入 token 约为 1.7 美元，每百万输出 token 为 5 美元，相比之下 Claude Sonnet 的输入价格为 3 美元，输出价格为 15 美元。但代理的成本不仅仅是模型定价。一旦代理开始跨文档、网络结果、工具和长期任务历史工作时，昂贵的部分往往是不断反馈给模型的上下文信息。大部分内容并不需要每次都出现在提示中。这就是 Milvus 发挥作用的地方。它为代理提供了记忆与检索层，使它们能够在不将整个历史记录加载到每个提示中的情况下，找到正确的的企业知识、过往对话或工具输出。对于像 Qwen3.7-Max 这样的模型而言，这意味着更优的实际经济性：减少浪费的 token、降低延迟并提升执行的准确性。#Qwen3_7 #Qwen #Milvus #Vectordatabase

上午 8:53 · 2026 年 5 月 23 日

·

279 次浏览

2

1