T
traeai
登录

概念

NVFP4

NVIDIA开发的4位浮点精度格式,专为LLM推理优化以平衡速度与准确率。

已跟踪 4 条高相关材料

TraeAI 观察

相关材料

已收录 4 条与 NVFP4 相关的内容,按评分排序。

Holo3.1: Fast & Local Computer Use Agents

Holo3.1: 快速且本地化的计算机使用代理

Hugging Face Blog808 字 (约 4 分钟)
85

Holo3.1 是 Hugging Face 推出的全新计算机使用代理模型,支持跨桌面、移动端与多框架部署,并首次提供 FP8/Q4 GGUF/NVFP4 量化权重以实现本地高效推理。

入选理由:Holo3.1 在 AndroidWorld 上 35B-A3B 模型准确率从 67% 提升至 79.3%

精选文章#计算机使用代理#Hugging Face#量化模型#移动端自动化英文
NVIDIA Nemotron 3 Ultra now available on Amazon SageMaker JumpStart

NVIDIA Nemotron 3 Ultra现已登陆Amazon SageMaker JumpStart

AWS Machine Learning Blog952 字 (约 4 分钟)
82

NVIDIA Nemotron 3 Ultra已在Amazon SageMaker JumpStart上线,支持一键部署。该550B参数MoE模型专为长程Agent设计,推理速度提升5倍,成本降低30%,支持1M上下文。

入选理由:Nemotron 3 Ultra采用混合Transformer-Mamba MoE架构,550B总参仅激活55B,显著降低Agent任务计算开销。

精选文章#Nemotron 3 Ultra#SageMaker JumpStart#Agentic AI#MoE#AWS英文
Long video generation is a systems problem.

Introducing LongLive-2.0 from NVIDIA Research: an end-t...

NVIDIA Research发布LongLive-2.0系统,采用端到端NVFP4训练和推理架构解决长视频生成问题,通过统一训练推理精度消除模型部署gap,提升速度和内存效率。

入选理由:LongLive-2.0采用NVFP4低精度训练推理架构

精选推文#NVIDIA#视频生成#低精度计算#AI系统英文
Nvidia presents LongLive-2.0

An NVFP4 Parallel Infrastructure for Long Video Generation

Nvidia发布LongLive-2.0

AK(@_akhaliq)52 字 (约 1 分钟)
45

Nvidia发布LongLive-2.0,这是一个用于长视频生成的NVFP4并行基础设施,但推文仅宣布产品名称,未披露任何技术实现细节。

入选理由:Nvidia发布LongLive-2.0长视频生成基础设施

精选推文#Nvidia#视频生成#NVFP4#并行计算#AI基础设施英文

跨材料问答 · NVFP4

回答基于:NVFP4 相关 4 条材料
    0 / 500

    AI 可能会生成不准确的信息,请核实重要内容