Step-3.7 Flash 全量免费 + Hermes Agent:这真的太疯狂了!
StepFun 推出新一代高效率编码代理模型 Step 3.7 Flash,支持多模态理解与长程规划;其最大亮点是在 Hermes Agent 中完全免费无限制使用,大幅降低开发者试用门槛。
入选理由:Step 3.7 Flash 是 StepFun 新一代 agentic coding 模型,含196B总参数 + 1.8B 视觉模块 + ~11B 激活参数,支持256K上下文窗口。
产品
别名:step3.7flash
Anthropic 公司推出的较便宜的大型语言模型。
已跟踪 8 条高相关材料
最近变化
2026-06-10 · Claude Fable 5 输入价格是 Step 3.7 Flash 的 50 倍。
为什么值得关注
Step 3.7 Flash 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。
Step-3.7 Flash FULLY FREE Unlimited API + Hermes Agent: THIS IS ACTUALLY CRAZY!
AICodeKing · 8.7 分
StepFun 推出全新高效率编码代理模型 Step 3.7 Flash,支持多模态理解、工具调用与长程规划;其核心亮点在于当前在 Hermes Agent 中完全免费无限制使用,打破行业常见 API 付费壁垒,显著降低开发者试用门槛。
Many research labs only consider inference efficiency after the fact. Step 3.7 Flash is a 196B MoE m...
Fireworks AI(@FireworksAI_HQ) · 8.5 分
Step 3.7 Flash 是一个专为推理优化设计的 196B MoE 模型,采用 MFA 和 AFD 技术,KV-cache 占用仅为 DeepSeek 的 22%,支持高效代理、编码和多模态任务,已开源并可在 Fireworks 平台使用。
任务成本仅为Claude Opus 4.6 1/9,阶跃刷新Flash模型效率
爱范儿 · 8.5 分
阶跃星辰发布的 Step 3.7 Flash 是面向生产级 AI Agent 的新一代 Flash 模型,具备原生多模态理解、高吞吐低延迟和联网搜索增强能力,在编程任务中性能接近 Claude Opus 4.6 的 97%,但成本仅为后者约 1/9,适合高频、复杂、真实工作流场...
已收录 8 条与 Step 3.7 Flash 相关的内容,按评分排序。
StepFun 推出新一代高效率编码代理模型 Step 3.7 Flash,支持多模态理解与长程规划;其最大亮点是在 Hermes Agent 中完全免费无限制使用,大幅降低开发者试用门槛。
入选理由:Step 3.7 Flash 是 StepFun 新一代 agentic coding 模型,含196B总参数 + 1.8B 视觉模块 + ~11B 激活参数,支持256K上下文窗口。
阶跃星辰发布的 Step 3.7 Flash 是面向生产级 AI Agent 的新一代 Flash 模型,具备原生多模态理解、高吞吐低延迟和联网搜索增强能力,在编程任务中性能接近 Claude Opus 4.6 的 97%,但成本仅为后者约 1/9,适合高频、复杂、真实工作流场景。
入选理由:Step 3.7 Flash 采用稀疏 MoE 架构,激活参数仅 11B,最高生成速度达 400 Tokens/s,支持 40 个 Agent 并行运行。
Step 3.7 Flash 是一个专为推理优化设计的 196B MoE 模型,采用 MFA 和 AFD 技术,KV-cache 占用仅为 DeepSeek 的 22%,支持高效代理、编码和多模态任务,已开源并可在 Fireworks 平台使用。
入选理由:Step 3.7 Flash 是 196B MoE 模型,从设计之初就聚焦推理效率,而非事后优化。
NVIDIA introduces Step 3.7 Flash for large-scale MoE models.
入选理由:Step 3.7 Flash 支持 198B 参数 MoE 模型,其中 11B 参数为活跃状态。
Claude Fable 5 相比 Step 3.7 Flash API 价格高出约 50 倍,Fast Mode 下价格差距扩大至 300 倍。
入选理由:Claude Fable 5 输入价格是 Step 3.7 Flash 的 50 倍。
文章仅提供了一个链接,介绍如何在 NVIDIA GPU 上运行 Step 3.7 Flash,缺乏深度和技术细节。
入选理由:文章链接指向 NVIDIA 开发者博客,介绍 Step 3.7 Flash 的运行方法。
Step 3.7 Flash通过MFA + AFD技术显著降低KV-cache成本,实现高效推理,支持一键部署。
入选理由:Step 3.7 Flash采用MFA + AFD技术,将KV-cache成本降至原模型的分数。
Step 3.7 Flash模型以400 tokens/秒的速度显著降低Agent任务成本,仅为Claude的零头。
入选理由:处理速度达400 tokens/秒