公司

Fireworks AI

Q: Fireworks AI 最近有什么新动态？

traeai 已收录 30 篇与 Fireworks AI 相关的内容。最新一篇是「Frontier models are powerful advisors. On @harvey's Legal Agent Benchmark, a GLM 5.1 worker using C...」，由 Fireworks AI(@FireworksAI_HQ) 发布。

别名：FireworksAI_HQ

提供 AI 模型服务的公司，上线了 Nemotron 3 Ultra 模型。

已跟踪 30 条高相关材料

TraeAI 观察

如果只读 3 篇

Frontier models are powerful advisors. On @harvey's Legal Agent Benchmark, a GLM 5.1 worker using C...

Fireworks AI(@FireworksAI_HQ) · 8.7 分

Fireworks AI 通过“harness + advisor”架构，在 Harvey 法务代理基准上以 Claude Opus 4.7 为稀疏顾问，将 GLM 5.1 工作者性能提升至 18/100 全对，成本仅为 Opus 39%。

Many research labs only consider inference efficiency after the fact. Step 3.7 Flash is a 196B MoE m...

Fireworks AI(@FireworksAI_HQ) · 8.5 分

Step 3.7 Flash 是一个专为推理优化设计的 196B MoE 模型，采用 MFA 和 AFD 技术，KV-cache 占用仅为 DeepSeek 的 22%，支持高效代理、编码和多模态任务，已开源并可在 Fireworks 平台使用。

Another proof point for the open-weights thesis. From @RampLabs: "If we built this again, we'd lea...

Fireworks AI(@FireworksAI_HQ) · 8.5 分

开放权重模型在实际应用中表现出显著成本优势，RampLabs 使用 Kimi K2.6 和 DeepSeek V4 Pro 发现高危漏洞，成本降低 5 倍。

前沿模型是强大的顾问

Fireworks AI(@FireworksAI_HQ)6月4日188 字 (约 1 分钟)

Fireworks AI 通过“harness + advisor”架构，在 Harvey 法务代理基准上以 Claude Opus 4.7 为稀疏顾问，将 GLM 5.1 工作者性能提升至 18/100 全对，成本仅为 Opus 的 39%。

入选理由：在 Harvey 法务代理基准上，GLM 5.1 + Claude Opus 4.7 稀疏顾问方案全对数达 18/100。

精选推文#前沿模型#法务代理基准#harness 设计#顾问模式#Claude Opus 4.7英文

Many research labs only consider inference efficiency after the fact. Step 3.7 Flash is a 196B MoE m...

Step 3.7 Flash：专为推理优化设计的 196B MoE 模型

Fireworks AI(@FireworksAI_HQ)6月2日183 字 (约 1 分钟)

入选理由：Step 3.7 Flash 是 196B MoE 模型，从设计之初就聚焦推理效率，而非事后优化。

精选推文#Step 3.7 Flash#MoE#推理优化#Fireworks AI#Apache 2.0英文

Another proof point for the open-weights thesis. From @RampLabs: "If we built this again, we'd lea...

Fireworks AI(@FireworksAI_HQ)5月30日129 字 (约 1 分钟)

开放权重模型在实际应用中表现出显著成本优势，RampLabs 使用 Kimi K2.6 和 DeepSeek V4 Pro 发现高危漏洞，成本降低 5 倍。

入选理由：RampLabs 使用 10K 代理测试后端，发现开放权重模型成本降低 5 倍。

精选推文#开放权重模型#AI安全#漏洞检测中文

10/ The bigger point: your product is the best RL environment you'll ever have.

Fireworks AI(@FireworksAI_HQ)5月27日201 字 (约 1 分钟)

Fireworks AI 提供了一种观点，即产品的成功在于其作为强化学习环境的独特性和适应性。

入选理由：产品的独特性是其最大的护城河。

精选推文#强化学习#产品设计#护城河中文

We ran 720 browser agent tasks with @nottecore across frontier models.

One baseline model produced...

Fireworks AI在X上：我们使用@nottecore在前沿模型上运行了720次浏览器代理任务

Fireworks AI(@FireworksAI_HQ)5月21日236 字 (约 1 分钟)

Fireworks AI测试显示，基线模型在浏览器代理任务中重试率达20%，而Kimi K2.5、GLM-5、MiniMax M2.5的重试率接近零，执行差异直接影响生产系统的成本、延迟和可靠性。

入选理由：基线模型在5次调用中约1次输出畸形，导致多步骤工作流重试

精选推文#Fireworks AI#浏览器代理#模型执行#重试率#成本优化英文

Fine-tuning used to mean a team, a GPU cluster, and weeks of iteration.

Fireworks AI(@FireworksAI_HQ)5月21日167 字 (约 1 分钟)

Fireworks AI指出，模型微调现在只需CLI命令、10分钟GPU时间和几美分，且可完全拥有权重，预训练模型虽已足够使用，但需进一步优化。

入选理由：模型微调时间从数周团队协作缩短到10分钟GPU计算，成本仅需几美分

精选推文#Fireworks AI#模型微调#LLM#CLI#GPU优化英文

Many research labs only consider inference efficiency after the fact. Step 3.7 Flash is a 198B spars...

Fireworks AI 推出 Step 3.7 Flash：从设计出发的 198B 稀疏 MoE 视觉语言模型

Fireworks AI(@FireworksAI_HQ)6月4日112 字 (约 1 分钟)

Fireworks AI 引入 Step 3.7 Flash：从推理效率出发设计的 198B 稀疏 MoE 视觉语言模型，集成 196B 语言与 1.8B 视觉编码器，实现实际代理任务最高 400 token/s 推理。

入选理由：从设计阶段即优化推理效率，非事后补强。

精选推文#Step3.7 Flash#稀疏 MoE#VLM#198B#400 token/s英文

Routing and post-training open-source models won't only give you more accurate systems but also mean...

开源模型路由与后训练：兼顾准确、快速与低成本的AI系统构建路径

clem 🤗(@ClementDelangue)6月5日172 字 (约 1 分钟)

对开源模型进行路由与后训练能显著提升AI系统的准确性、速度和成本效益。Harvey与Fireworks AI的实测表明，采用GLM 5.1作为主Worker并选择性调用前沿模型的混合架构，在法律领域实现了质量与成本的双重优化，证明开源微调加智能路由是替代纯前沿模型的高性价比工程路径。

入选理由：Harvey实测显示混合法律Agent在质量和成本上均优于单一前沿模型。

精选推文#模型路由#后训练#开源大模型#混合Agent#法律AI英文

This tracks. 30 trillion tokens a day on our end, and open model share keeps climbing. Our partner...

Fireworks AI(@FireworksAI_HQ)5月30日107 字 (约 1 分钟)

Fireworks AI 每日处理 30 万亿 token，开放模型使用量持续增长，Factory AI 的开放模型使用量在过去一个月内增长了 3 倍。

入选理由：Fireworks AI 每日处理 30 万亿 token，显示其在大规模数据处理能力上的优势。

精选推文#AI#Open Models#Fireworks AI#Factory AI英文

Nathan's @cursor_ai team didn't prompt-engineer their way to Composer 2.5. They trained it. The mass...

Fireworks AI(@FireworksAI_HQ)5月22日150 字 (约 1 分钟)

Cursor团队通过强化学习训练而非提示工程实现Composer 2.5，其大规模RL程序在Fireworks上运行推理，预示2027年后自训练模型将成为竞争护城河的唯一方式。

入选理由：Cursor团队使用强化学习训练Composer 2.5，而非提示工程方法

精选推文#AI训练#强化学习#Cursor#Fireworks#模型训练英文

The @cursor_ai team shipped Composer 2 and now Composer 2.5 on the same Kimi K2.5 base model. Perfor...

Fireworks AI(@FireworksAI_HQ)5月20日166 字 (约 1 分钟)

Cursor AI在Kimi K2.5基座模型上迭代出Composer 2.5，85%性能提升来自强化学习，Fireworks AI提供RL训练基础设施，实现前沿质量与开源经济的平衡。

入选理由：Composer 2.5基于Kimi K2.5模型，性能显著提升，85%的算力增益来自强化学习（RL）。

精选推文#Composer#Kimi K2.5#强化学习#Fireworks AI#Cursor AI英文

Fireworks Training Platform keeps expanding. Leading US open weight model Nemotron 3 Ultra is now ...

Fireworks AI(@FireworksAI_HQ)6月10日115 字 (约 1 分钟)

Fireworks AI 扩展其训练平台，支持 Nemotron 3 Ultra 模型的微调和 DPO 训练。

入选理由：Nemotron 3 Ultra 现在支持 SFT 和 DPO 训练。

精选推文#Fireworks AI#Nemotron 3 Ultra#模型训练#SFT#DPO英文

Day 2 at #MSBuild is about what it takes to move beyond generic foundation models.

Think customiza...

Day 2 at #MSBuild 是关于如何超越通用基础模型

Fireworks AI(@FireworksAI_HQ)6月4日93 字 (约 1 分钟)

MSBuild 第二天聚焦超越通用基础模型，强调定制化、推理性能与规模化部署，@chahvivi 将进行现场演示与真实案例分享。

入选理由：MSBuild 第二天主题：超越通用基础模型，关注定制化、推理性能与规模化部署。

精选推文#MSBuild#AI#定制化#推理性能#规模化部署英文

Fine-tuning to production inference is the gap where teams get stuck.

At #MSBuild today, our own Ro...

从微调到生产推理：团队卡点与解决方案

Fireworks AI(@FireworksAI_HQ)6月4日88 字 (约 1 分钟)

从微调到生产推理的落地缺口是团队卡点，Fireworks AI 在 MSBuild 分享定制化权衡、服务架构选择与规模化成本/延迟优化。

入选理由：微调到生产推理存在落地缺口，团队常在定制化与性能之间权衡。

精选推文#微调#生产推理#服务架构#成本优化#延迟优化英文

Weekends are for vibe coding. But are your vibes continuously improving?
Fine-tune your own model → ...

Fireworks AI 新增训练更新

Fireworks AI(@FireworksAI_HQ)5月18日213 字 (约 1 分钟)

Fireworks AI 引入新训练更新，支持 Gemma 4 Dense 模型在 256K 上进行 SFT、DPO 或 RL 训练。

入选理由：Gemma 4 Dense is now available for Full Param + LoRA RL on 256K context.

精选推文#AI#训练#模型开发#自训练中文

Fireworks AI 模型更新：Gemma 4 Dense 推出

Fireworks AI(@FireworksAI_HQ)5月18日204 字 (约 1 分钟)

Fireworks AI 推出 Gemma 4 Dense 模型，支持自定义微调、256K 上下文和多种训练方式。

入选理由：Fireworks AI 推出 Gemma 4 Dense 模型，支持 Full Param + LoRA RL 训练

精选推文#AI#模型#训练#微调中文

Fireworks Training Platform continues to expand.

Fireworks AI(@FireworksAI_HQ)5月15日221 字 (约 1 分钟)

Fireworks AI宣布其训练平台新增GLM 5.1 LoRA RL功能，支持SFT、DPO和完整RL。

入选理由：GLM 5.1 LoRA RL支持SFT、DPO和完整RL训练

精选推文#AI训练#LoRA#GLM中文

𝐅𝐮𝐥𝐥-𝐏𝐚𝐫𝐚𝐦 𝐑𝐋 𝐧𝐨𝐰 𝐚𝐯𝐚𝐢𝐥𝐚𝐛𝐥𝐞 𝐟𝐨𝐫 𝐊𝐢𝐦𝐢 𝐊𝟐.𝟔

You've been told only 3 ...

_FULL-PARAM RL NOW AVAILABLE FOR KIMI K2.6_

Fireworks AI(@FireworksAI_HQ)5月13日216 字 (约 1 分钟)

Fireworks AI宣布其Kimi K2.6模型现在支持全参数强化学习，允许用户在其基础上进行完全自定义训练，以实现最大数据护城河。

入选理由：Fireworks AI的Kimi K2.6模型现在支持全参数强化学习，提供256K上下文。

精选推文#AI#机器学习#强化学习#Fireworks AI#Kimi K2.6中文

NVIDIA Nemotron 3 Ultra is on Fireworks, day zero. Nemotron Ultra is an open model for frontier rea...

Fireworks AI(@FireworksAI_HQ)6月10日110 字 (约 1 分钟)

NVIDIA Nemotron 3 Ultra 模型已在 Fireworks AI 上线，适用于复杂自主代理的推理和编排。

入选理由：NVIDIA Nemotron 3 Ultra 是一款用于前沿推理和编排的开放模型。

精选推文#NVIDIA#Fireworks AI#AI模型#自主代理英文

Microsoft MAI models. Coming soon to Fireworks.

Intelligence you control. End-to-end lineage you ca...

Microsoft MAI 模型。即将登陆 Fireworks。

Fireworks AI(@FireworksAI_HQ)6月2日102 字 (约 1 分钟)

Fireworks AI 宣布即将推出 Microsoft MAI 模型，提供企业级定制化推理模型服务。

入选理由：Microsoft MAI 模型将集成至 Fireworks 平台，提供企业级定制化推理能力。

精选推文#AI#模型微调#企业级应用#数据隐私#可追溯性中英混合

Move from test to production by running high-performance inference directly on Foundry.

At #MSBuild...

Fireworks AI：在 Foundry 上实现高性能推理，从测试到生产

Fireworks AI(@FireworksAI_HQ)6月2日177 字 (约 1 分钟)

Fireworks AI 在 MSBuild 展示了其在 Foundry 上直接运行高性能推理的端到端工作流，强调统一基础设施可降低延迟、成本并简化部署。

入选理由：Fireworks AI 在 MSBuild 展示 Foundry 上的高性能推理解决方案。

精选推文#AI#Foundry#MSBuild#企业级应用#高性能推理英文

If you're calling a third-party API, your competitor can make the same call tomorrow.

@lqiao is the...

Fireworks AI on X: "如果你调用第三方API，你的竞争对手明天也可以调用。"

Fireworks AI(@FireworksAI_HQ)5月15日177 字 (约 1 分钟)

文章指出，使用第三方API可能让竞争对手获得相同能力，强调通过微调模型和反馈循环构建持久竞争优势。

入选理由：使用第三方API可能让竞争对手获得相同能力

精选推文#AI#API#竞争策略中文

Most teams can pick frontier models.

Fewer can run them at production scale without hitting constra...

Fireworks AI on X: "Most teams can pick frontier models."

Fireworks AI(@FireworksAI_HQ)5月15日165 字 (约 1 分钟)

多数团队可选前沿模型，但难以实现生产级部署。

入选理由：多数团队可选前沿模型

精选推文#AI#模型部署#Azure中文

free to start. fast on day zero. proud to power the default model for LangSmith Fleet. happy buildin...

Fireworks AI 在 X 上宣布：免费启动，零日快速，自豪地为 LangSmith Fleet 提供默认模型。

Fireworks AI(@FireworksAI_HQ)5月15日78 字 (约 1 分钟)

Fireworks AI 宣布为 LangSmith Fleet 提供免费默认模型，降低开发者入门门槛。

入选理由：LangSmith Fleet 现提供免费模型，支持 Developer 和 Plus 计划。

精选推文#AI#开发工具中文

We spent the week at #MSBuild talking about one thing: fine-tuning has gone from "maybe not worth it...

Fireworks AI(@FireworksAI_HQ)6月10日124 字 (约 1 分钟)

文章讨论了微调在AI模型中的重要性，但信息密度低，缺乏具体技术细节和实用建议。

入选理由：微调可能成为企业竞争的关键优势。

精选推文#AI#微调#Fireworks AI#Microsoft Foundry中英混合

Fireworks was named to @Redpoint's InfraRed 100 which recognizes the companies building the foundati...

Fireworks AI(@FireworksAI_HQ)6月10日140 字 (约 1 分钟)

Fireworks AI 被 Redpoint 的 InfraRed 100 列表收录，该列表表彰构建下一代 AI 基础设施的公司。

入选理由：Fireworks AI 被列入 Redpoint 的 InfraRed 100 列表。

精选推文#AI#基础设施#Fireworks AI#Redpoint英文

a new era of hackathons:
2005→ look what i built with web search
2016 → can you build a rails app i...

Fireworks AI on X: 新时代黑客马拉松

Fireworks AI(@FireworksAI_HQ)5月18日184 字 (约 1 分钟)

Fireworks AI宣布新时代黑客马拉松，展示AI工具快速开发能力。

入选理由：2025: Spin up a CX bot with Claude in 5 minutes.

精选推文#AI#Hackathon#Product#Tech#Engineering中文

great agents need great infrastructure. proud to be @LangChain's Deep Agents Inference Partner at In...

Fireworks AI在X上的声明：优秀代理需要强大基础设施

Fireworks AI(@FireworksAI_HQ)5月15日162 字 (约 1 分钟)

Fireworks AI宣布成为LangChain的Deep Agents Inference合作伙伴，参与Interrupt 2026大会。

入选理由：Fireworks AI成为LangChain Deep Agents Inference合作伙伴

精选推文#AI代理#基础设施#LangChain#Fireworks AI中文

We’re looking forward to seeing how developers and enterprises use Fireworks AI on @Microsoft Foundr...

Fireworks AI 在 Microsoft Foundry 上展示

Fireworks AI(@FireworksAI_HQ)6月2日103 字 (约 1 分钟)

Fireworks AI 宣布将在 Microsoft Foundry 上展示其 AI 工具，并邀请开发者和企业于 MSBuild 大会期间在 F111 展位体验。

入选理由：Fireworks AI 将在 Microsoft Foundry 平台上展示其 AI 工具。

精选推文#AI#微软#MSBuild#Fireworks AI#企业应用英文

Production AI systems place very different demands on infrastructure once workloads scale.

How?

Jo...

生产级AI系统在负载扩展后对基础设施提出不同需求

Fireworks AI(@FireworksAI_HQ)6月2日88 字 (约 1 分钟)

生产级AI系统在负载扩展后对基础设施提出不同需求，但该推文未提供具体技术细节或机制说明，仅作为活动推广。

入选理由：生产级AI系统在扩展时对基础设施有特殊需求，但文中未说明具体表现。

精选推文#AI#基础设施#MSBuild#Fireworks AI英文

跨材料问答 · Fireworks AI

回答基于：Fireworks AI 相关 30 条材料