模型

Qwen3.7-Max

Q: 什么是 Qwen3.7-Max？

阿里巴巴通义千问系列中的高性能模型。

Q: Qwen3.7-Max 最近有什么新动态？

traeai 已收录 12 篇与 Qwen3.7-Max 相关的内容。最新一篇是「ITBench-AA: Frontier Models Score Below 50% on the First Benchmark for Agentic Enterprise IT Tasks — by Artificial Analysis and IBM」，由 Hugging Face Blog 发布。

别名：通义千问3.7-Max

阿里巴巴通义千问系列中的高性能模型。

已跟踪 12 条高相关材料

TraeAI 观察

如果只读 3 篇

ITBench-AA: Frontier Models Score Below 50% on the First Benchmark for Agentic Enterprise IT Tasks — by Artificial Analysis and IBM

Hugging Face Blog · 8.5 分

ITBench-AA 是一个针对企业级自动化 IT 任务的新基准测试，首次评估前沿模型在 Site Reliability Engineering 任务中的表现，结果显示所有前沿模型得分低于 50%，其中 Claude Opus 4.7 表现最佳，为 47%。

Qwen3.7-Max 成为全球第二AI编程模型

AI HOT 精选 · 8.5 分

Qwen3.7-Max 成为全球第二 AI 编程模型，得分 1541，在 Code Arena 上仅落后于 Claude。该模型适用于生产环境，能够处理 35 小时的任务、1000 多次工具调用，并在几小时内完成两周的项目。

ITBench-AA: 前沿模型在第一个企业级自动化 IT 任务基准测试中得分低于 50% —— 由人工分析和 IBM 推出

Hugging Face Blog5月27日861 字 (约 4 分钟)

入选理由：Claude Opus 4.7 在 ITBench-AA 中表现最佳，得分为 47%

精选文章#ITBench-AA#Site Reliability Engineering#前沿模型#IBM#Kubernetes中文

Qwen3.7-Max 成为全球第二AI编程模型

AI HOT 精选5月26日152 字 (约 1 分钟)

入选理由：Qwen3.7-Max 在 Code Arena 上得分为 1541，仅次于 Claude。

精选文章#Qwen3.7-Max#阿里云#Code Arena#AI 编程模型#生产环境中文

The new Qwen3.7-Max from @Alibaba_Qwen is live on OpenRouter. The flagship of the Qwen3.7 series, b...

OpenRouter(@OpenRouterAI)5月22日127 字 (约 1 分钟)

阿里巴巴推出全新升级的超大规模语言模型 Qwen3.7-Max，该模型专为代理中心工作设计，如编码、办公和生产任务以及长期自主执行。相较于前代 Qwen3.6，Qwen3.7-Max 在编码和代理基准测试中取得了显著进步，并引入了显式提示缓存功能，以优化重复上下文的处理。

入选理由：Qwen3.7-Max 是阿里巴巴最新发布的超大规模语言模型，专注于代理中心任务，如编码和办公自动化。

精选推文#Qwen3.7-Max#阿里巴巴#语言模型#代理中心工作#编码#办公自动化#自主执行#人工智能中文

Performance：Qwen3.7-Max performs strongly across benchmarks in coding agents , and improves massivel...

Qwen(@Alibaba_Qwen)5月22日105 字 (约 1 分钟)

Qwen3.7-Max在编码代理和通用代理的基准测试中表现出色，尤其在最难的推理基准上表现出色，并在通用能力和多语言支持方面脱颖而出。

入选理由：Qwen3.7-Max在编码代理的基准测试中表现出色。

精选推文#Qwen#AI模型#性能评估#编码代理#通用代理#多语言支持中文

🚀Qwen3.7-Max just landed at 56.6 on the Artificial Analysis Intelligence Index — a solid 4.8pt jump...

Qwen(@Alibaba_Qwen)5月22日138 字 (约 1 分钟)

Qwen3.7-Max 在人工智能分析指数上获得了56.6分，比Qwen3.6-Max-Preview提高了4.8分。它在科学推理、代理能力、编码能力和减少幻觉方面都有显著提升。

入选理由：Qwen3.7-Max在人工智能分析指数上得分56.6，比前一版本提高了4.8分。

精选推文#Qwen#Alibaba#AI模型#人工智能分析指数中文

Artificial Analysis放榜：千问3.7问鼎国产模型冠军，全球前五

量子位5月21日1050 字 (约 5 分钟)

阿里云Qwen3.7-Max以56.6分位列Artificial Analysis全球大模型榜单第五、国产第一，即将上线阿里云百炼API服务。

入选理由：Qwen3.7-Max得分56.6分，超越国产所有模型，逼近GPT-5.4、Gemini3.1 Pro等国际顶尖模型

精选文章#Qwen3.7-Max#Artificial Analysis#大模型评测#阿里云中文

📢Qwen3.7-Max just hit #3 on ITbench-AA — a fresh benchmark testing how well models handle real-worl...

Qwen(@Alibaba_Qwen)5月29日125 字 (约 1 分钟)

Qwen3.7-Max 在 ITbench-AA 基准测试中排名第三，该测试评估模型处理企业级 IT 任务的能力。

入选理由：Qwen3.7-Max 在 ITbench-AA 测试中表现优异，排名第三。

精选推文#Qwen#ITbench-AA#AI模型#企业IT中英混合

This time, 𝗤𝘄𝗲𝗻𝟯.𝟳-𝗠𝗮𝘅 was not released with open weights. But for enterprise agents, it is...

Qwen3.7-Max 未开源权重，但对企业代理仍具高性价比

Milvus(@milvusio)5月24日333 字 (约 2 分钟)

Qwen3.7-Max未开源权重，但因其在企业代理场景下的高性价比和优异性能表现，成为值得关注的模型。

入选理由：Qwen3.7-Max在Terminal-Bench 2.0得分为69.7，SWE-Pro为60.6，SWE-Verified为80.4。

精选推文#Qwen#Milvus#Agent#Vector Database#LLM英文

Arena.ai on X: Qwen3.7 Max (20250517) debuts at #4 in Code Arena: Frontend - the top-ranked Chinese lab on the board, surpassing GLM-5.1 and is now on par with Claude Opus 4.6 on agentic web development tasks.

lmarena.ai(@lmarena_ai)5月27日136 字 (约 1 分钟)

Qwen3.7 Max 在 Code Arena: Frontend 中排名第 4，超越 GLM-5.1 并与 Claude Opus 4.6 在代理 Web 开发任务中持平。

入选理由：Qwen3.7 Max 排名第 4

精选推文#Code Arena#Frontend#Qwen3.7 Max中文

Paul Couvert 在 X 上的消息：你可以在这里限时五折体验 Qwen3.7-Max

Paul Couvert(@itsPaulAi)5月25日129 字 (约 1 分钟)

文章仅为推广阿里通义千问Qwen3.7-Max的限时优惠活动，缺乏技术深度与实用信息。

入选理由：Qwen3.7-Max 提供限时五折优惠，可通过指定链接访问。

精选推文#Qwen#AI模型#促销英文

⚡️⚡️

Qwen(@Alibaba_Qwen)5月23日72 字 (约 1 分钟)

阿里巴巴通义千问团队发布了Qwen3.7-Max模型，该模型针对代理中心化工作场景进行优化，在编码和代理基准测试中相比Qwen3.6有显著提升。

入选理由：Qwen3.7-Max是通义千问Qwen3.7系列的旗舰模型

精选推文#Qwen#AI模型#阿里巴巴#大语言模型中文

跨材料问答 · Qwen3.7-Max

回答基于：Qwen3.7-Max 相关 12 条材料