Step 3.7 Flash:专为推理优化设计的 196B MoE 模型
Step 3.7 Flash 是一个专为推理优化设计的 196B MoE 模型,采用 MFA 和 AFD 技术,KV-cache 占用仅为 DeepSeek 的 22%,支持高效代理、编码和多模态任务,已开源并可在 Fireworks 平台使用。
入选理由:Step 3.7 Flash 是 196B MoE 模型,从设计之初就聚焦推理效率,而非事后优化。
概念
别名:Apache License 2.0
宽松的开源软件许可证,允许商业使用、修改和分发,无需开源衍生作品。
已跟踪 6 条高相关材料
最近变化
2026-06-04 · Gemma 4 12B是120亿参数开源多模态模型,可在普通笔记本上直接运行推理。
为什么值得关注
Apache 2.0 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。
Many research labs only consider inference efficiency after the fact. Step 3.7 Flash is a 196B MoE m...
Fireworks AI(@FireworksAI_HQ) · 8.5 分
Step 3.7 Flash 是一个专为推理优化设计的 196B MoE 模型,采用 MFA 和 AFD 技术,KV-cache 占用仅为 DeepSeek 的 22%,支持高效代理、编码和多模态任务,已开源并可在 Fireworks 平台使用。
Are scaling laws finally working for time series foundation models? Today, @datadoghq is releasing ...
clem 🤗(@ClementDelangue) · 8.5 分
Datadog 发布 Toto 2.0,首次实现时间序列基础模型的规模定律,参数从 4M 到 2.5B 均表现优于前代。
Celebrating the milestone of a massive 150+ million downloads of Gemma 4 with the release of the new...
Demis Hassabis(@demishassabis) · 7.5 分
Google发布Gemma 4 12B多模态模型,支持在16GB显存笔记本本地运行且采用Apache 2.0开源协议。该模型累计下载量已超1.5亿次,以无编码器统一架构平衡了边缘端效率与高级推理能力,适合开发者快速构建本地AI应用。
已收录 6 条与 Apache 2.0 相关的内容,按评分排序。
Step 3.7 Flash 是一个专为推理优化设计的 196B MoE 模型,采用 MFA 和 AFD 技术,KV-cache 占用仅为 DeepSeek 的 22%,支持高效代理、编码和多模态任务,已开源并可在 Fireworks 平台使用。
入选理由:Step 3.7 Flash 是 196B MoE 模型,从设计之初就聚焦推理效率,而非事后优化。
Datadog 发布 Toto 2.0,首次实现时间序列基础模型的规模定律。
入选理由:Toto 2.0 参数范围覆盖 4M 到 2.5B,每个版本均超越前代性能。
Google发布Gemma 4 12B多模态模型,支持在16GB显存笔记本本地运行且采用Apache 2.0开源协议。该模型累计下载量已超1.5亿次,以无编码器统一架构平衡了边缘端效率与高级推理能力,适合开发者快速构建本地AI应用。
入选理由:Gemma 4 12B可在仅16GB VRAM的笔记本上本地运行,大幅降低多模态模型部署门槛。
Gemma 4 12B是首个支持原生音频输入的中型多模态模型,采用无编码器统一架构,仅需16GB显存即可运行,性能接近26B模型且遵循Apache 2.0开源协议。
入选理由:Gemma 4 12B采用无编码器统一架构,直接将视觉与音频信号输入LLM,降低推理延迟。
Google发布开源多模态模型Gemma 4 12B,采用Apache 2.0许可,支持笔记本端侧直接运行。该模型为无编码器统一架构,兼顾边缘效率与高级推理能力,适合本地AI应用开发。
入选理由:Gemma 4 12B是120亿参数开源多模态模型,可在普通笔记本上直接运行推理。
Cohere宣布以Apache 2.0许可证开源Command A+,提供企业级智能体能力,支持从实验到生产的全流程。
入选理由:Cohere开源Command A+采用Apache 2.0许可证