智谱GLM-5.1高速版发布:刷新全球大模型API速度纪录
智谱发布GLM-5.1高速版API,实现400 tokens/s的全球最快大模型API速度,同时保持旗舰级能力,适用于AI编程、实时交互等高延迟要求场景。
入选理由:GLM-5.1高速版API达到400 tokens/s,刷新全球大模型API速度纪录。
产品
智谱GLM团队与合作伙伴联合打造的推理引擎,用于优化大模型推理性能。
已跟踪 2 条高相关材料
最近变化
2026-05-22 · 智谱GLM-5.1-highspeed API达到400 tokens/s生成速度,是顶流模型中最快的旗舰级API
为什么值得关注
TileRT 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。
已收录 2 条与 TileRT 相关的内容,按评分排序。
智谱发布GLM-5.1高速版API,实现400 tokens/s的全球最快大模型API速度,同时保持旗舰级能力,适用于AI编程、实时交互等高延迟要求场景。
入选理由:GLM-5.1高速版API达到400 tokens/s,刷新全球大模型API速度纪录。
智谱推出GLM-5.1-highspeed API,达到400 tokens/s的生成速度,成为顶流模型中最快的旗舰级API,通过系统工程优化实现高速推理,改变了AI编程和Agent交互体验。
入选理由:智谱GLM-5.1-highspeed API达到400 tokens/s生成速度,是顶流模型中最快的旗舰级API