Fireworks AI在X上:我们使用@nottecore在前沿模型上运行了720次浏览器代理任务
Fireworks AI测试显示,基线模型在浏览器代理任务中重试率达20%,而Kimi K2.5、GLM-5、MiniMax M2.5的重试率接近零,执行差异直接影响生产系统的成本、延迟和可靠性。
入选理由:基线模型在5次调用中约1次输出畸形,导致多步骤工作流重试
模型
别名:kimi-k2.5
Fireworks平台支持的先进语言模型
已跟踪 3 条高相关材料
最近变化
2026-05-20 · 基线模型在5次调用中约1次输出畸形,导致多步骤工作流重试
为什么值得关注
Kimi K2.5 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。
We ran 720 browser agent tasks with @nottecore across frontier models. One baseline model produced...
Fireworks AI(@FireworksAI_HQ) · 8.5 分
Fireworks AI测试显示,基线模型在浏览器代理任务中重试率达20%,而Kimi K2.5、GLM-5、MiniMax M2.5的重试率接近零,执行差异直接影响生产系统的成本、延迟和可靠性。
The @cursor_ai team shipped Composer 2 and now Composer 2.5 on the same Kimi K2.5 base model. Perfor...
Fireworks AI(@FireworksAI_HQ) · 7.2 分
Cursor AI在Kimi K2.5基座模型上迭代出Composer 2.5,85%性能提升来自强化学习,Fireworks AI提供RL训练基础设施,实现前沿质量与开源经济的平衡。
Composer 2.5 is built on the same open-source base as Composer 2, Moonshot’s Kimi K2.5.
Cursor(@cursor_ai) · 2.5 分
Cursor 官方 Twitter 账号发布简短声明,宣布 Composer 2.5 基于与 Composer 2 相同的开源基础构建,并提及 Moonshot 的 Kimi K2.5,但未提供任何技术细节或架构说明。
已收录 3 条与 Kimi K2.5 相关的内容,按评分排序。
Fireworks AI测试显示,基线模型在浏览器代理任务中重试率达20%,而Kimi K2.5、GLM-5、MiniMax M2.5的重试率接近零,执行差异直接影响生产系统的成本、延迟和可靠性。
入选理由:基线模型在5次调用中约1次输出畸形,导致多步骤工作流重试
Cursor AI在Kimi K2.5基座模型上迭代出Composer 2.5,85%性能提升来自强化学习,Fireworks AI提供RL训练基础设施,实现前沿质量与开源经济的平衡。
入选理由:Composer 2.5基于Kimi K2.5模型,性能显著提升,85%的算力增益来自强化学习(RL)。
Cursor 官方 Twitter 账号发布简短声明,宣布 Composer 2.5 基于与 Composer 2 相同的开源基础构建,并提及 Moonshot 的 Kimi K2.5,但未提供任何技术细节或架构说明。
入选理由:Composer 2.5 与 Composer 2 共享同一开源代码基础