T
traeai
登录

模型

GLM-5

通义千问系列大模型

已跟踪 2 条高相关材料

TraeAI 观察

相关材料

已收录 2 条与 GLM-5 相关的内容,按评分排序。

We ran 720 browser agent tasks with @nottecore across frontier models. 

One baseline model produced...

Fireworks AI在X上:我们使用@nottecore在前沿模型上运行了720次浏览器代理任务

Fireworks AI(@FireworksAI_HQ)236 字 (约 1 分钟)
85

Fireworks AI测试显示,基线模型在浏览器代理任务中重试率达20%,而Kimi K2.5、GLM-5、MiniMax M2.5的重试率接近零,执行差异直接影响生产系统的成本、延迟和可靠性。

入选理由:基线模型在5次调用中约1次输出畸形,导致多步骤工作流重试

精选推文#Fireworks AI#浏览器代理#模型执行#重试率#成本优化英文
智谱公布“降智”的秘密:Scaling不可避免的痛

智谱公布“降智”的秘密:Scaling不可避免的痛

量子位1854 字 (约 8 分钟)
85

智谱技术博客揭示了在大规模Coding Agent推理过程中遇到的"Scaling Pain",包括乱码、复读和生僻字等异常现象,通过深入排查发现这些问题源于高负载下的推理状态管理不当。文章分享了投机采样作为异常检测指标的策略,以及修复KV Cache竞态和HiCache加载时序问题的具体方案,并提出了Prefill阶段的LayerSplit优化来缓解内存与带宽压力,最终显著提升了系统性能。

入选理由:智谱遭遇的异常现象(乱码、复读、生僻字)根源在于高负载推理状态管理问题。

精选文章#智谱#GLM-5#Scaling Pain#推理引擎#Coding Agent中文

跨材料问答 · GLM-5

回答基于:GLM-5 相关 2 条材料
    0 / 500

    AI 可能会生成不准确的信息,请核实重要内容