T
traeai
登录

公司

Fireworks AI

别名:FireworksAI_HQ

提供 AI 模型服务的公司,上线了 Nemotron 3 Ultra 模型。

已跟踪 30 条高相关材料

TraeAI 观察

相关材料

已收录 30 条与 Fireworks AI 相关的内容,按评分排序。

Frontier models are powerful advisors.

On @harvey's Legal Agent Benchmark, a GLM 5.1 worker using C...

前沿模型是强大的顾问

Fireworks AI(@FireworksAI_HQ)188 字 (约 1 分钟)
87

Fireworks AI 通过“harness + advisor”架构,在 Harvey 法务代理基准上以 Claude Opus 4.7 为稀疏顾问,将 GLM 5.1 工作者性能提升至 18/100 全对,成本仅为 Opus 的 39%。

入选理由:在 Harvey 法务代理基准上,GLM 5.1 + Claude Opus 4.7 稀疏顾问方案全对数达 18/100。

精选推文#前沿模型#法务代理基准#harness 设计#顾问模式#Claude Opus 4.7英文
Many research labs only consider inference efficiency after the fact. Step 3.7 Flash is a 196B MoE m...

Step 3.7 Flash:专为推理优化设计的 196B MoE 模型

Fireworks AI(@FireworksAI_HQ)183 字 (约 1 分钟)
85

Step 3.7 Flash 是一个专为推理优化设计的 196B MoE 模型,采用 MFA 和 AFD 技术,KV-cache 占用仅为 DeepSeek 的 22%,支持高效代理、编码和多模态任务,已开源并可在 Fireworks 平台使用。

入选理由:Step 3.7 Flash 是 196B MoE 模型,从设计之初就聚焦推理效率,而非事后优化。

精选推文#Step 3.7 Flash#MoE#推理优化#Fireworks AI#Apache 2.0英文
We ran 720 browser agent tasks with @nottecore across frontier models. 

One baseline model produced...

Fireworks AI在X上:我们使用@nottecore在前沿模型上运行了720次浏览器代理任务

Fireworks AI(@FireworksAI_HQ)236 字 (约 1 分钟)
85

Fireworks AI测试显示,基线模型在浏览器代理任务中重试率达20%,而Kimi K2.5、GLM-5、MiniMax M2.5的重试率接近零,执行差异直接影响生产系统的成本、延迟和可靠性。

入选理由:基线模型在5次调用中约1次输出畸形,导致多步骤工作流重试

精选推文#Fireworks AI#浏览器代理#模型执行#重试率#成本优化英文
Fine-tuning used to mean a team, a GPU cluster, and weeks of iteration.

Now it's just a CLI command...

Fine-tuning used to mean a team, a GPU cluster, and weeks of iteration.

Fireworks AI(@FireworksAI_HQ)167 字 (约 1 分钟)
85

Fireworks AI指出,模型微调现在只需CLI命令、10分钟GPU时间和几美分,且可完全拥有权重,预训练模型虽已足够使用,但需进一步优化。

入选理由:模型微调时间从数周团队协作缩短到10分钟GPU计算,成本仅需几美分

精选推文#Fireworks AI#模型微调#LLM#CLI#GPU优化英文
Many research labs only consider inference efficiency after the fact. Step 3.7 Flash is a 198B spars...

Fireworks AI 推出 Step 3.7 Flash:从设计出发的 198B 稀疏 MoE 视觉语言模型

Fireworks AI(@FireworksAI_HQ)112 字 (约 1 分钟)
82

Fireworks AI 引入 Step 3.7 Flash:从推理效率出发设计的 198B 稀疏 MoE 视觉语言模型,集成 196B 语言与 1.8B 视觉编码器,实现实际代理任务最高 400 token/s 推理。

入选理由:从设计阶段即优化推理效率,非事后补强。

精选推文#Step3.7 Flash#稀疏 MoE#VLM#198B#400 token/s英文
Routing and post-training open-source models won't only give you more accurate systems but also mean...

开源模型路由与后训练:兼顾准确、快速与低成本的AI系统构建路径

clem 🤗(@ClementDelangue)172 字 (约 1 分钟)
78

对开源模型进行路由与后训练能显著提升AI系统的准确性、速度和成本效益。Harvey与Fireworks AI的实测表明,采用GLM 5.1作为主Worker并选择性调用前沿模型的混合架构,在法律领域实现了质量与成本的双重优化,证明开源微调加智能路由是替代纯前沿模型的高性价比工程路径。

入选理由:Harvey实测显示混合法律Agent在质量和成本上均优于单一前沿模型。

精选推文#模型路由#后训练#开源大模型#混合Agent#法律AI英文
This tracks. 30 trillion tokens a day on our end, and open model share keeps climbing. 

Our partner...

Fireworks AI 每日处理 30 万亿 token,开放模型使用量持续增长,Factory AI 的开放模型使用量在过去一个月内增长了 3 倍。

入选理由:Fireworks AI 每日处理 30 万亿 token,显示其在大规模数据处理能力上的优势。

精选推文#AI#Open Models#Fireworks AI#Factory AI英文
Nathan's @cursor_ai team didn't prompt-engineer their way to Composer 2.5. They trained it. The mass...

Cursor团队通过强化学习训练而非提示工程实现Composer 2.5,其大规模RL程序在Fireworks上运行推理,预示2027年后自训练模型将成为竞争护城河的唯一方式。

入选理由:Cursor团队使用强化学习训练Composer 2.5,而非提示工程方法

精选推文#AI训练#强化学习#Cursor#Fireworks#模型训练英文
The @cursor_ai team shipped Composer 2 and now Composer 2.5 on the same Kimi K2.5 base model. Perfor...

Cursor AI在Kimi K2.5基座模型上迭代出Composer 2.5,85%性能提升来自强化学习,Fireworks AI提供RL训练基础设施,实现前沿质量与开源经济的平衡。

入选理由:Composer 2.5基于Kimi K2.5模型,性能显著提升,85%的算力增益来自强化学习(RL)。

精选推文#Composer#Kimi K2.5#强化学习#Fireworks AI#Cursor AI英文
Day 2 at #MSBuild is about what it takes to move beyond generic foundation models. 

Think customiza...

Day 2 at #MSBuild 是关于如何超越通用基础模型

Fireworks AI(@FireworksAI_HQ)93 字 (约 1 分钟)
65

MSBuild 第二天聚焦超越通用基础模型,强调定制化、推理性能与规模化部署,@chahvivi 将进行现场演示与真实案例分享。

入选理由:MSBuild 第二天主题:超越通用基础模型,关注定制化、推理性能与规模化部署。

精选推文#MSBuild#AI#定制化#推理性能#规模化部署英文
Fine-tuning to production inference is the gap where teams get stuck.

At #MSBuild today, our own Ro...

从微调到生产推理:团队卡点与解决方案

Fireworks AI(@FireworksAI_HQ)88 字 (约 1 分钟)
65

从微调到生产推理的落地缺口是团队卡点,Fireworks AI 在 MSBuild 分享定制化权衡、服务架构选择与规模化成本/延迟优化。

入选理由:微调到生产推理存在落地缺口,团队常在定制化与性能之间权衡。

精选推文#微调#生产推理#服务架构#成本优化#延迟优化英文
Weekends are for vibe coding. But are your vibes continuously improving?
Fine-tune your own model → ...

Fireworks AI 新增训练更新

Fireworks AI(@FireworksAI_HQ)213 字 (约 1 分钟)
65

Fireworks AI 引入新训练更新,支持 Gemma 4 Dense 模型在 256K 上进行 SFT、DPO 或 RL 训练。

入选理由:Gemma 4 Dense is now available for Full Param + LoRA RL on 256K context.

精选推文#AI#训练#模型开发#自训练中文
Weekends are for vibe coding. But are your vibes continuously improving?

Fine-tune your own model →...

Fireworks AI 模型更新:Gemma 4 Dense 推出

Fireworks AI(@FireworksAI_HQ)204 字 (约 1 分钟)
65

Fireworks AI 推出 Gemma 4 Dense 模型,支持自定义微调、256K 上下文和多种训练方式。

入选理由:Fireworks AI 推出 Gemma 4 Dense 模型,支持 Full Param + LoRA RL 训练

精选推文#AI#模型#训练#微调中文
Fireworks Training Platform continues to expand.
Today GLM 5.1 LoRA RL is now live via Training API:...

Fireworks Training Platform continues to expand.

Fireworks AI(@FireworksAI_HQ)221 字 (约 1 分钟)
65

Fireworks AI宣布其训练平台新增GLM 5.1 LoRA RL功能,支持SFT、DPO和完整RL。

入选理由:GLM 5.1 LoRA RL支持SFT、DPO和完整RL训练

精选推文#AI训练#LoRA#GLM中文
𝐅𝐮𝐥𝐥-𝐏𝐚𝐫𝐚𝐦 𝐑𝐋 𝐧𝐨𝐰 𝐚𝐯𝐚𝐢𝐥𝐚𝐛𝐥𝐞 𝐟𝐨𝐫 𝐊𝐢𝐦𝐢 𝐊𝟐.𝟔

You've been told only 3 ...

_FULL-PARAM RL NOW AVAILABLE FOR KIMI K2.6_

Fireworks AI(@FireworksAI_HQ)216 字 (约 1 分钟)
65

Fireworks AI宣布其Kimi K2.6模型现在支持全参数强化学习,允许用户在其基础上进行完全自定义训练,以实现最大数据护城河。

入选理由:Fireworks AI的Kimi K2.6模型现在支持全参数强化学习,提供256K上下文。

精选推文#AI#机器学习#强化学习#Fireworks AI#Kimi K2.6中文
Microsoft MAI models. Coming soon to Fireworks.

Intelligence you control. End-to-end lineage you ca...

Microsoft MAI 模型。即将登陆 Fireworks。

Fireworks AI(@FireworksAI_HQ)102 字 (约 1 分钟)
55

Fireworks AI 宣布即将推出 Microsoft MAI 模型,提供企业级定制化推理模型服务。

入选理由:Microsoft MAI 模型将集成至 Fireworks 平台,提供企业级定制化推理能力。

精选推文#AI#模型微调#企业级应用#数据隐私#可追溯性中英混合
Move from test to production by running high-performance inference directly on Foundry.

At #MSBuild...

Fireworks AI:在 Foundry 上实现高性能推理,从测试到生产

Fireworks AI(@FireworksAI_HQ)177 字 (约 1 分钟)
55

Fireworks AI 在 MSBuild 展示了其在 Foundry 上直接运行高性能推理的端到端工作流,强调统一基础设施可降低延迟、成本并简化部署。

入选理由:Fireworks AI 在 MSBuild 展示 Foundry 上的高性能推理解决方案。

精选推文#AI#Foundry#MSBuild#企业级应用#高性能推理英文
Most teams can pick frontier models.

Fewer can run them at production scale without hitting constra...

Fireworks AI on X: "Most teams can pick frontier models."

Fireworks AI(@FireworksAI_HQ)165 字 (约 1 分钟)
55

多数团队可选前沿模型,但难以实现生产级部署。

入选理由:多数团队可选前沿模型

精选推文#AI#模型部署#Azure中文
a new era of hackathons:
2005→ look what i built with web search 
2016 → can you build a rails app i...

Fireworks AI on X: 新时代黑客马拉松

Fireworks AI(@FireworksAI_HQ)184 字 (约 1 分钟)
50

Fireworks AI宣布新时代黑客马拉松,展示AI工具快速开发能力。

入选理由:2025: Spin up a CX bot with Claude in 5 minutes.

精选推文#AI#Hackathon#Product#Tech#Engineering中文
great agents need great infrastructure. proud to be @LangChain's Deep Agents Inference Partner at In...

Fireworks AI在X上的声明:优秀代理需要强大基础设施

Fireworks AI(@FireworksAI_HQ)162 字 (约 1 分钟)
50

Fireworks AI宣布成为LangChain的Deep Agents Inference合作伙伴,参与Interrupt 2026大会。

入选理由:Fireworks AI成为LangChain Deep Agents Inference合作伙伴

精选推文#AI代理#基础设施#LangChain#Fireworks AI中文
We’re looking forward to seeing how developers and enterprises use Fireworks AI on @Microsoft Foundr...

Fireworks AI 在 Microsoft Foundry 上展示

Fireworks AI(@FireworksAI_HQ)103 字 (约 1 分钟)
35

Fireworks AI 宣布将在 Microsoft Foundry 上展示其 AI 工具,并邀请开发者和企业于 MSBuild 大会期间在 F111 展位体验。

入选理由:Fireworks AI 将在 Microsoft Foundry 平台上展示其 AI 工具。

精选推文#AI#微软#MSBuild#Fireworks AI#企业应用英文
Production AI systems place very different demands on infrastructure once workloads scale.

How?

Jo...

生产级AI系统在负载扩展后对基础设施提出不同需求

Fireworks AI(@FireworksAI_HQ)88 字 (约 1 分钟)
35

生产级AI系统在负载扩展后对基础设施提出不同需求,但该推文未提供具体技术细节或机制说明,仅作为活动推广。

入选理由:生产级AI系统在扩展时对基础设施有特殊需求,但文中未说明具体表现。

精选推文#AI#基础设施#MSBuild#Fireworks AI英文

跨材料问答 · Fireworks AI

回答基于:Fireworks AI 相关 30 条材料
    0 / 500

    AI 可能会生成不准确的信息,请核实重要内容