NVFP4 最近有什么新动态？

traeai 已收录 4 篇与 NVFP4 相关的内容。最新一篇是「Holo3.1: Fast & Local Computer Use Agents」，由 Hugging Face Blog 发布。

概念

NVFP4

NVIDIA开发的4位浮点精度格式，专为LLM推理优化以平衡速度与准确率。

已跟踪 4 条高相关材料

Holo3.1: Fast & Local Computer Use Agents

Hugging Face Blog · 8.5 分

Holo3.1 是 Hugging Face 推出的全新计算机使用代理模型，支持跨桌面、移动端与多框架部署，并首次提供 FP8/Q4 GGUF/NVFP4 量化权重以实现本地高效推理。

NVIDIA Nemotron 3 Ultra now available on Amazon SageMaker JumpStart

AWS Machine Learning Blog · 8.2 分

NVIDIA Nemotron 3 Ultra已在Amazon SageMaker JumpStart上线，支持一键部署。该550B参数MoE模型专为长程Agent设计，推理速度提升5倍，成本降低30%，支持1M上下文。

Long video generation is a systems problem. Introducing LongLive-2.0 from NVIDIA Research: an end-t...

NVIDIA AI(@NVIDIAAI) · 7.5 分

NVIDIA Research发布LongLive-2.0系统，采用端到端NVFP4训练和推理架构解决长视频生成问题，通过统一训练推理精度消除模型部署gap，提升速度和内存效率。

Hugging Face Blog6月2日808 字 (约 4 分钟)

Holo3.1 是 Hugging Face 推出的全新计算机使用代理模型，支持跨桌面、移动端与多框架部署，并首次提供 FP8/Q4 GGUF/NVFP4 量化权重以实现本地高效推理。

入选理由：Holo3.1 在 AndroidWorld 上 35B-A3B 模型准确率从 67% 提升至 79.3%

精选文章#计算机使用代理#Hugging Face#量化模型#移动端自动化英文

AWS Machine Learning Blog昨天952 字 (约 4 分钟)

NVIDIA Nemotron 3 Ultra已在Amazon SageMaker JumpStart上线，支持一键部署。该550B参数MoE模型专为长程Agent设计，推理速度提升5倍，成本降低30%，支持1M上下文。

入选理由：Nemotron 3 Ultra采用混合Transformer-Mamba MoE架构，550B总参仅激活55B，显著降低Agent任务计算开销。

精选文章#Nemotron 3 Ultra#SageMaker JumpStart#Agentic AI#MoE#AWS英文

NVIDIA AI(@NVIDIAAI)5月23日197 字 (约 1 分钟)

NVIDIA Research发布LongLive-2.0系统，采用端到端NVFP4训练和推理架构解决长视频生成问题，通过统一训练推理精度消除模型部署gap，提升速度和内存效率。

入选理由：LongLive-2.0采用NVFP4低精度训练推理架构

精选推文#NVIDIA#视频生成#低精度计算#AI系统英文

AK(@_akhaliq)5月20日52 字 (约 1 分钟)

Nvidia发布LongLive-2.0，这是一个用于长视频生成的NVFP4并行基础设施，但推文仅宣布产品名称，未披露任何技术实现细节。

入选理由：Nvidia发布LongLive-2.0长视频生成基础设施

精选推文#Nvidia#视频生成#NVFP4#并行计算#AI基础设施英文

回答基于：NVFP4 相关 4 条材料