前沿模型是强大的顾问
Fireworks AI 通过“harness + advisor”架构,在 Harvey 法务代理基准上以 Claude Opus 4.7 为稀疏顾问,将 GLM 5.1 工作者性能提升至 18/100 全对,成本仅为 Opus 的 39%。
入选理由:在 Harvey 法务代理基准上,GLM 5.1 + Claude Opus 4.7 稀疏顾问方案全对数达 18/100。
公司
别名:FireworksAI_HQ
提供 AI 模型服务的公司,上线了 Nemotron 3 Ultra 模型。
已跟踪 30 条高相关材料
最近变化
2026-06-06 · Nemotron 3 Ultra 现在支持 SFT 和 DPO 训练。
为什么值得关注
Fireworks AI 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。
Frontier models are powerful advisors. On @harvey's Legal Agent Benchmark, a GLM 5.1 worker using C...
Fireworks AI(@FireworksAI_HQ) · 8.7 分
Fireworks AI 通过“harness + advisor”架构,在 Harvey 法务代理基准上以 Claude Opus 4.7 为稀疏顾问,将 GLM 5.1 工作者性能提升至 18/100 全对,成本仅为 Opus 39%。
Many research labs only consider inference efficiency after the fact. Step 3.7 Flash is a 196B MoE m...
Fireworks AI(@FireworksAI_HQ) · 8.5 分
Step 3.7 Flash 是一个专为推理优化设计的 196B MoE 模型,采用 MFA 和 AFD 技术,KV-cache 占用仅为 DeepSeek 的 22%,支持高效代理、编码和多模态任务,已开源并可在 Fireworks 平台使用。
Another proof point for the open-weights thesis. From @RampLabs: "If we built this again, we'd lea...
Fireworks AI(@FireworksAI_HQ) · 8.5 分
开放权重模型在实际应用中表现出显著成本优势,RampLabs 使用 Kimi K2.6 和 DeepSeek V4 Pro 发现高危漏洞,成本降低 5 倍。
已收录 30 条与 Fireworks AI 相关的内容,按评分排序。
Fireworks AI 通过“harness + advisor”架构,在 Harvey 法务代理基准上以 Claude Opus 4.7 为稀疏顾问,将 GLM 5.1 工作者性能提升至 18/100 全对,成本仅为 Opus 的 39%。
入选理由:在 Harvey 法务代理基准上,GLM 5.1 + Claude Opus 4.7 稀疏顾问方案全对数达 18/100。
Step 3.7 Flash 是一个专为推理优化设计的 196B MoE 模型,采用 MFA 和 AFD 技术,KV-cache 占用仅为 DeepSeek 的 22%,支持高效代理、编码和多模态任务,已开源并可在 Fireworks 平台使用。
入选理由:Step 3.7 Flash 是 196B MoE 模型,从设计之初就聚焦推理效率,而非事后优化。
开放权重模型在实际应用中表现出显著成本优势,RampLabs 使用 Kimi K2.6 和 DeepSeek V4 Pro 发现高危漏洞,成本降低 5 倍。
入选理由:RampLabs 使用 10K 代理测试后端,发现开放权重模型成本降低 5 倍。
Fireworks AI 提供了一种观点,即产品的成功在于其作为强化学习环境的独特性和适应性。
入选理由:产品的独特性是其最大的护城河。
Fireworks AI测试显示,基线模型在浏览器代理任务中重试率达20%,而Kimi K2.5、GLM-5、MiniMax M2.5的重试率接近零,执行差异直接影响生产系统的成本、延迟和可靠性。
入选理由:基线模型在5次调用中约1次输出畸形,导致多步骤工作流重试
Fireworks AI指出,模型微调现在只需CLI命令、10分钟GPU时间和几美分,且可完全拥有权重,预训练模型虽已足够使用,但需进一步优化。
入选理由:模型微调时间从数周团队协作缩短到10分钟GPU计算,成本仅需几美分
Fireworks AI 引入 Step 3.7 Flash:从推理效率出发设计的 198B 稀疏 MoE 视觉语言模型,集成 196B 语言与 1.8B 视觉编码器,实现实际代理任务最高 400 token/s 推理。
入选理由:从设计阶段即优化推理效率,非事后补强。
对开源模型进行路由与后训练能显著提升AI系统的准确性、速度和成本效益。Harvey与Fireworks AI的实测表明,采用GLM 5.1作为主Worker并选择性调用前沿模型的混合架构,在法律领域实现了质量与成本的双重优化,证明开源微调加智能路由是替代纯前沿模型的高性价比工程路径。
入选理由:Harvey实测显示混合法律Agent在质量和成本上均优于单一前沿模型。
Fireworks AI 每日处理 30 万亿 token,开放模型使用量持续增长,Factory AI 的开放模型使用量在过去一个月内增长了 3 倍。
入选理由:Fireworks AI 每日处理 30 万亿 token,显示其在大规模数据处理能力上的优势。
Cursor团队通过强化学习训练而非提示工程实现Composer 2.5,其大规模RL程序在Fireworks上运行推理,预示2027年后自训练模型将成为竞争护城河的唯一方式。
入选理由:Cursor团队使用强化学习训练Composer 2.5,而非提示工程方法
Cursor AI在Kimi K2.5基座模型上迭代出Composer 2.5,85%性能提升来自强化学习,Fireworks AI提供RL训练基础设施,实现前沿质量与开源经济的平衡。
入选理由:Composer 2.5基于Kimi K2.5模型,性能显著提升,85%的算力增益来自强化学习(RL)。
Fireworks AI 扩展其训练平台,支持 Nemotron 3 Ultra 模型的微调和 DPO 训练。
入选理由:Nemotron 3 Ultra 现在支持 SFT 和 DPO 训练。
MSBuild 第二天聚焦超越通用基础模型,强调定制化、推理性能与规模化部署,@chahvivi 将进行现场演示与真实案例分享。
入选理由:MSBuild 第二天主题:超越通用基础模型,关注定制化、推理性能与规模化部署。
从微调到生产推理的落地缺口是团队卡点,Fireworks AI 在 MSBuild 分享定制化权衡、服务架构选择与规模化成本/延迟优化。
入选理由:微调到生产推理存在落地缺口,团队常在定制化与性能之间权衡。
Fireworks AI 引入新训练更新,支持 Gemma 4 Dense 模型在 256K 上进行 SFT、DPO 或 RL 训练。
入选理由:Gemma 4 Dense is now available for Full Param + LoRA RL on 256K context.
Fireworks AI 推出 Gemma 4 Dense 模型,支持自定义微调、256K 上下文和多种训练方式。
入选理由:Fireworks AI 推出 Gemma 4 Dense 模型,支持 Full Param + LoRA RL 训练
Fireworks AI宣布其训练平台新增GLM 5.1 LoRA RL功能,支持SFT、DPO和完整RL。
入选理由:GLM 5.1 LoRA RL支持SFT、DPO和完整RL训练
Fireworks AI宣布其Kimi K2.6模型现在支持全参数强化学习,允许用户在其基础上进行完全自定义训练,以实现最大数据护城河。
入选理由:Fireworks AI的Kimi K2.6模型现在支持全参数强化学习,提供256K上下文。
NVIDIA Nemotron 3 Ultra 模型已在 Fireworks AI 上线,适用于复杂自主代理的推理和编排。
入选理由:NVIDIA Nemotron 3 Ultra 是一款用于前沿推理和编排的开放模型。
Fireworks AI 宣布即将推出 Microsoft MAI 模型,提供企业级定制化推理模型服务。
入选理由:Microsoft MAI 模型将集成至 Fireworks 平台,提供企业级定制化推理能力。
Fireworks AI 在 MSBuild 展示了其在 Foundry 上直接运行高性能推理的端到端工作流,强调统一基础设施可降低延迟、成本并简化部署。
入选理由:Fireworks AI 在 MSBuild 展示 Foundry 上的高性能推理解决方案。
文章指出,使用第三方API可能让竞争对手获得相同能力,强调通过微调模型和反馈循环构建持久竞争优势。
入选理由:使用第三方API可能让竞争对手获得相同能力
多数团队可选前沿模型,但难以实现生产级部署。
入选理由:多数团队可选前沿模型
Fireworks AI 宣布为 LangSmith Fleet 提供免费默认模型,降低开发者入门门槛。
入选理由:LangSmith Fleet 现提供免费模型,支持 Developer 和 Plus 计划。
文章讨论了微调在AI模型中的重要性,但信息密度低,缺乏具体技术细节和实用建议。
入选理由:微调可能成为企业竞争的关键优势。
Fireworks AI 被 Redpoint 的 InfraRed 100 列表收录,该列表表彰构建下一代 AI 基础设施的公司。
入选理由:Fireworks AI 被列入 Redpoint 的 InfraRed 100 列表。
Fireworks AI宣布新时代黑客马拉松,展示AI工具快速开发能力。
入选理由:2025: Spin up a CX bot with Claude in 5 minutes.
Fireworks AI宣布成为LangChain的Deep Agents Inference合作伙伴,参与Interrupt 2026大会。
入选理由:Fireworks AI成为LangChain Deep Agents Inference合作伙伴
Fireworks AI 宣布将在 Microsoft Foundry 上展示其 AI 工具,并邀请开发者和企业于 MSBuild 大会期间在 F111 展位体验。
入选理由:Fireworks AI 将在 Microsoft Foundry 平台上展示其 AI 工具。
生产级AI系统在负载扩展后对基础设施提出不同需求,但该推文未提供具体技术细节或机制说明,仅作为活动推广。
入选理由:生产级AI系统在扩展时对基础设施有特殊需求,但文中未说明具体表现。