前沿模型是强大的顾问
Fireworks AI 通过“harness + advisor”架构,在 Harvey 法务代理基准上以 Claude Opus 4.7 为稀疏顾问,将 GLM 5.1 工作者性能提升至 18/100 全对,成本仅为 Opus 的 39%。
入选理由:在 Harvey 法务代理基准上,GLM 5.1 + Claude Opus 4.7 稀疏顾问方案全对数达 18/100。
模型
别名:GLM5.1
智谱开源大模型,在Harvey混合架构中担任主要Worker角色。
已跟踪 17 条高相关材料
最近变化
2026-06-04 · Code Arena 前端排名第7,得分1531,与GLM-5.1并列。
为什么值得关注
GLM 5.1 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。
MiniMax M3 has landed in the Arena and has moved the Pareto frontier! Their latest model ranks #7 f...
lmarena.ai(@lmarena_ai) · 8.7 分
MiniMax M3 登场 Code Arena 前端第7,得分1531,与 GLM-5.1 并列领先,价格带 Pareto 前沿达 $0.60/ $2.40 每Mtoken。
Frontier models are powerful advisors. On @harvey's Legal Agent Benchmark, a GLM 5.1 worker using C...
Fireworks AI(@FireworksAI_HQ) · 8.7 分
Fireworks AI 通过“harness + advisor”架构,在 Harvey 法务代理基准上以 Claude Opus 4.7 为稀疏顾问,将 GLM 5.1 工作者性能提升至 18/100 全对,成本仅为 Opus 39%。
Arena's AI Capability Lead @petergostev runs @AnthropicAI's latest Claude Opus 4.8 through 200+ Code...
lmarena.ai(@lmarena_ai) · 8.5 分
测试包括与 Gemini 和 GLM 的对比,涵盖多种场景。
已收录 17 条与 GLM 5.1 相关的内容,按评分排序。
Fireworks AI 通过“harness + advisor”架构,在 Harvey 法务代理基准上以 Claude Opus 4.7 为稀疏顾问,将 GLM 5.1 工作者性能提升至 18/100 全对,成本仅为 Opus 的 39%。
入选理由:在 Harvey 法务代理基准上,GLM 5.1 + Claude Opus 4.7 稀疏顾问方案全对数达 18/100。
MiniMax M3 登场 Code Arena 前端第7,得分1531,与 GLM-5.1 并列领先,价格带 Pareto 前沿达 $0.60/ $2.40 每Mtoken。
入选理由:Code Arena 前端排名第7,得分1531,与GLM-5.1并列。
测试包括与 Gemini 和 GLM 的对比,涵盖多种场景。
入选理由:Claude Opus 4.8 在 200 多项前端测试中胜过 Gemini 3.1 Pro 和 GLM 5.1。
智谱发布GLM-5.1高速版API,实现400 tokens/s的全球最快大模型API速度,同时保持旗舰级能力,适用于AI编程、实时交互等高延迟要求场景。
入选理由:GLM-5.1高速版API达到400 tokens/s,刷新全球大模型API速度纪录。
中国开源模型与美国前沿模型能力差距持续扩大,CAISI评估显示差距达3-7个月。
入选理由:CAISI评估显示中国开源模型在多个基准测试中落后于美国模型,差距达3-7个月。
AI 工程师 @aiDotEngineer 在推特上分享了关于开放源代码模型训练的新进展。
入选理由:开放源代码模型领先闭源模型指数级增长
Qwen 3.7 Max 在 Arena Coding Agent 上排名第四,超越 GLM-5.1,与 Claude Opus 4.6 并驾齐驱。
入选理由:Qwen 3.7 Max 排名第四
对开源模型进行路由与后训练能显著提升AI系统的准确性、速度和成本效益。Harvey与Fireworks AI的实测表明,采用GLM 5.1作为主Worker并选择性调用前沿模型的混合架构,在法律领域实现了质量与成本的双重优化,证明开源微调加智能路由是替代纯前沿模型的高性价比工程路径。
入选理由:Harvey实测显示混合法律Agent在质量和成本上均优于单一前沿模型。
Fireworks 推出 Serverless 2.0,提供三种服务路径以优化 GPU 使用效率和可靠性。
入选理由:Serverless 2.0 提供 Standard、Priority 和 Fast 三种服务路径。
Ollama 新增 NVIDIA Blackwell GPU 以更好支持 GLM-5.1 模型。
入选理由:Ollama 已扩展 NVIDIA Blackwell GPU 阵容以优化 GLM-5.1 模型性能。
Fireworks AI 平台正式支持智谱 GLM 5.1 模型,提供 SFT/DPO 微调能力、200K 超长上下文窗口,专为长周期智能体编程微调优化,RL 训练即将上线。
入选理由:GLM 5.1 已集成至 Fireworks AI 托管与 API 训练工作流
Fireworks AI宣布其训练平台新增GLM 5.1 LoRA RL功能,支持SFT、DPO和完整RL。
入选理由:GLM 5.1 LoRA RL支持SFT、DPO和完整RL训练
Ollama 推荐了多个与 Codex 配合使用的模型,包括支持视觉的 kimi-k2.6 和 glm-5.1。
入选理由:kimi-k2.6 支持视觉功能,适合图像相关任务。
Ollama 推出新一代旗舰模型 GLM-5.1,代码生成能力显著提升。
入选理由:GLM-5.1 是 Ollama 的新一代旗舰模型。
GLM-5.1在AA全新Coding Agent基准测试中获得第一,展示了其在代码生成领域的卓越表现。
入选理由:GLM-5.1在AA基准测试中排名第一,展现了其在代码生成领域的强大能力。
本文介绍了如何在VS Code中集成DeepSeek V4、GLM-5.1、Kimi K2.6等AI模型,通过Continuedev插件实现代码补全、AI聊天和编辑功能。
入选理由:通过Continuedev插件可以在VS Code中运行DeepSeek V4、GLM-5.1、Kimi K2.6等AI模型。
Qwen3.7 Max 在 Code Arena: Frontend 中排名第 4,超越 GLM-5.1 并与 Claude Opus 4.6 在代理 Web 开发任务中持平。
入选理由:Qwen3.7 Max 排名第 4