#567. 黄仁勋:Agent 时代普通人和企业的新生产力,AI 基础设施竞赛下的计算革命
黄仁勋在GTC Taipei 2026上宣布Agentic AI时代已到来,AI从内容生成转向自主执行任务,NVIDIA推出Vera Rubin、Vera CPU等基础设施产品,推动计算范式变革,使AI成为利润与GDP的直接生成器。
入选理由:NVIDIA发布Vera Rubin超级计算系统,专为Agent设计,支持解耦、异构和分布式AI工作负载。
公司
别名:NVIDIA AI
全球领先的GPU与AI计算平台公司,Nemotron系列模型的发布方。
已跟踪 30 条高相关材料
最近变化
2026-06-05 · NVIDIA Nemotron 3 Ultra已在OpenRouter上线并标记为免费,降低高性能模型试用门槛。
为什么值得关注
NVIDIA 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。
#567. 黄仁勋:Agent 时代普通人和企业的新生产力,AI 基础设施竞赛下的计算革命
跨国串门儿计划 · 9.2 分
黄仁勋在GTC Taipei 2026上宣布Agentic AI时代已到来,AI从内容生成转向自主执行任务,NVIDIA推出Vera Rubin、Vera CPU等基础设施产品,推动计算范式变革,使AI成为利润与GDP的直接生成器。
Cosmos 3 is here.
NVIDIA Developer · 9 分
NVIDIA 推出 Cosmos 3,一个基于新型混合 Transformer 架构的开放通用模型,专为物理 AI 设计,能生成物理准确的合成视频、作为世界模型和模拟器,并支持机器人等实体智能系统的训练与推理。
Nemotron 3 Ultra NVIDIA's 550B Open Model
Sam Witteveen · 8.7 分
Nvidia 推出 550B 参数 Neotron 3 Ultra,采用混合专家架构与 55B 活跃参数,专为代理任务训练,实测在代理基准上超越多款万亿参数模型,并公开数据与配方,利于企业本地化与定制微调。
已收录 30 条与 NVIDIA 相关的内容,按评分排序。
黄仁勋在GTC Taipei 2026上宣布Agentic AI时代已到来,AI从内容生成转向自主执行任务,NVIDIA推出Vera Rubin、Vera CPU等基础设施产品,推动计算范式变革,使AI成为利润与GDP的直接生成器。
入选理由:NVIDIA发布Vera Rubin超级计算系统,专为Agent设计,支持解耦、异构和分布式AI工作负载。
NVIDIA 推出 Cosmos 3,一个基于新型混合 Transformer 架构的开放通用模型,专为物理 AI 设计,能生成物理准确的合成视频、作为世界模型和模拟器,并支持机器人等实体智能系统的训练与推理。
入选理由:Cosmos 3 使用新型混合 Transformer 架构,结合自回归和扩散 Transformer 实现感知、推理与生成。
NVIDIA 推出Nemotron 3 Ultra,550B参数的开放模型,面向长时运行的智能代理,采用LatentMoE与多令牌预测,在同等推理成本下专家数提升4倍,强调速度与智能正相关,并以Open MDW许可面向企业落地。
入选理由:Nemotron 3 Ultra 为 550B 参数模型,基于与 Nemotron 3 Super 相同架构,面向长时运行的智能代理场景。
NVIDIA 推出 5500 亿参数的 Neotron 3 Ultra,采用混合专家架构并专为代理任务训练,在代理基准上超越多款万亿参数模型,且公开数据与配方,便于企业本地部署与定制微调。
入选理由:Neotron 3 Ultra 为 550B 参数混合专家模型,活跃参数约 55B,专为代理任务训练。
平台周期的变化导致客户开始 consolidation around platforms that deliver more outcomes on fewer contracts。
入选理由:Partners are becoming increasingly important in helping customers navigate change.
微软Surface RTX Spark Dev Box以Mac mini尺寸设计,搭载NVIDIA最新RTX Spark芯片、128GB内存及1 petaflop算力,支持本地运行1200亿参数大模型,定位开发者AI工作负载场景。机身采用阳极氧化铝3D打印工艺,顶部1000通风孔实现无风扇散热,预装Windows 11 Pro开发环境并适配WSL/VS Code/GitHub Copilot,定价预计$3000-$3500,将于年内登陆美国市场。
入选理由:设备集成128GB内存与1 PFLOPS算力,可在本地部署1200亿参数大模型而无需云端GPU
NVIDIA 通过 NemoClaw 部署 Nous Research 的 Hermes Agent,实现一次教学、持久记忆的智能代理,支持连接 Slack、Outlook、GitHub 等工具,并将聊天修正转化为可复用技能。
入选理由:Hermes Agent 可通过 NVIDIA NemoClaw 和 OpenShell 实现跨平台集成,连接 Slack、Outlook、GitHub 等服务。
NVIDIA 推出自进化 Hermes 智能体,通过持续学习和反馈机制实现企业级 AI 的自主优化,显著提升任务执行效率与准确性。
入选理由:Hermes 智能体采用自进化架构,可在运行中自动优化自身行为策略。
NVIDIA通过NemoClaw蓝图和Open Shell策略实现了安全的自进化Hermes代理系统,平衡内部数据访问与外部安全边界。
入选理由:NVIDIA使用Open Shell策略定义安全边界,允许代理访问内部数据但禁止外部发布。
NVIDIA Nemotron 3 Ultra已在Amazon SageMaker JumpStart上线,支持一键部署。该550B参数MoE模型专为长程Agent设计,推理速度提升5倍,成本降低30%,支持1M上下文。
入选理由:Nemotron 3 Ultra采用混合Transformer-Mamba MoE架构,550B总参仅激活55B,显著降低Agent任务计算开销。
Nvidia RTX Spark芯片因重GPU轻CPU的设计难以胜任2026年Agentic AI时代的本地推理需求。Ben Thompson指出,当前AI Agent依赖强CPU与云端协同,而该芯片牺牲CPU性能换取GPU规模,仅适合2023年聊天机器人场景,在Windows on ARM生态下性价比存疑。
入选理由:RTX Spark配备20核Arm CPU、6144 CUDA核心及128GB内存,但解码速度低于M5 Max。
NVIDIA宣布推出Cosmos 3,这是物理AI领域的突破性成果,全球领先。
入选理由:Cosmos 3是NVIDIA推出的物理AI基础模型,处于世界领先地位。
Nvidia在台北GTC大会发布Neotron 3 Ultra开源模型(5500亿参数)和Vera CPU,前者5倍更快30%更便宜,后者专为AI代理设计。
入选理由:Neotron 3 Ultra拥有5500亿参数,基于混合Mamba Transformer架构,推理速度提升5倍。
NVIDIA发布550B参数MoE开源模型Nemotron 3 Ultra,专为长时运行Agent设计,推理速度提升5倍且复杂任务成本降低30%。
入选理由:Nemotron 3 Ultra采用550B参数MoE架构,是面向前沿智能的开源模型。
NVIDIA 的 DGX Spark 和 NemoClaw 提供了一键式 AI 代理部署方案,将传统复杂的模型源、推理后端配置、运行时安装和集成流程简化为单条命令,显著提升了开发效率。
入选理由:DGX Spark 和 NemoClaw 将 AI 代理部署时间从数小时缩短至几分钟。
NVIDIA 推出 Cosmos 3,这是首个面向物理 AI 的全模态模型,支持多模态输入与复杂物理场景理解,适用于机器人、自动驾驶和工业仿真等应用。
入选理由:Cosmos 3 是首个专为物理 AI 设计的全模态模型,能处理图像、文本、点云等多种输入。
NVIDIA 推出 Forward Dynamics 技术,通过物理仿真模拟未来世界,赋能自动驾驶、机器人和工业设计等领域的 AI 决策训练。
入选理由:Forward Dynamics 使用 GPU 加速的物理引擎实时模拟复杂环境动态变化。
NVIDIA DGX Station 开始向开发者和研究人员交付,企业团队可通过 GB300 系统实现本地数据中心级性能。
入选理由:NVIDIA DGX Station 已开始交付给开发者和研究人员。
NVIDIA AI 推出逆动力学技术,通过观察状态变化反推执行的动作,适用于机器人、物理模拟和AI控制等领域。
入选理由:逆动力学可从系统状态变化中推断出导致该变化的动作,提升AI对环境的推理能力。
Ethan He在Latent.Space播客中指出,视频生成模型的智能主要来自语言而非视频数据,当前从想法到代码的转化速度已显著提升,但后端开发仍是瓶颈,未来技术前沿将聚焦于世界模型、持续学习和智能体。
入选理由:视频生成模型的智能主要来源于语言数据,而非视频数据本身。
Satya Nadella感谢Jensen Huang参加Build活动,并表达了对NVIDIA在云和边缘领域的深度合作的感激之情。
入选理由:Satya Nadella感谢Jensen Huang参加Build活动
NVIDIA发布经后训练的Ultra开源前沿模型,专为OpenClaw、Hermes Agent及LangChain等主流Agent框架优化,支持开发者定制跨领域专用智能体。
入选理由:NVIDIA Ultra模型针对OpenClaw、Hermes Agent和LangChain三大Agent框架进行了专项后训练优化。
NVIDIA宣布Nemotron 3 Ultra模型完全开源,包含权重、合成数据及后训练配方,现已在Hugging Face上线。
入选理由:Nemotron 3 Ultra开源内容涵盖模型权重、合成数据集和完整的后训练配方(recipes)。
本文汇总了 Anthropic、微软、NVIDIA、OpenAI 和 Google 的近期动态,包括 Anthropic 提交 S-1 文件、微软与英伟达发布新笔记本、OpenAI 宣布 130 亿美元 AI 弹性计划及新建数据中心、谷歌计划筹集 800 亿美元建设数据中心。
入选理由:Anthropic 已向 SEC 提交首次公开募股(S-1)文件。
Lex Fridman记录了与NVIDIA CEO黄仁勋在台湾的行程,包括与数千名工程师交流及夜市体验。黄仁勋在当地受到极高欢迎,被视为科技界偶像,但文章未深入探讨技术细节或对工程实践的具体影响。
入选理由:Jensen Huang在台湾受工程师热烈追捧,氛围如摇滚明星巡演
今日AI领域主要动态包括NVIDIA在堆栈中集成智能体、Bernie Sanders推动公共AI权益立法、Claude会话转化为技能、Meta AI被黑客利用访问Instagram账户,以及多个新工具发布。
入选理由:NVIDIA正在将AI代理(agents)跨硬件和软件堆栈集成,以提升系统协同效率。
宇宙联盟是由 NVIDIA 和顶尖 AI 实验室发起的全球性倡议,旨在构建并开源用于物理 AI 的前沿世界模型,Runway 作为创始成员参与其中。
入选理由:Cosmos Coalition 由 NVIDIA 和领先 AI 实验室共同发起,目标是构建开放的世界模型。
NVIDIA Nemotron 3 Ultra在智能体任务中实现领先准确率,覆盖生产力、编码及长周期规划场景。该推文仅为产品发布预告,缺乏基准测试数据与技术细节,工程参考价值有限。
入选理由:Nemotron 3 Ultra主打Agent任务,涵盖编码、生产力工具及长周期规划三大核心场景。
英伟达发布Nemotron 3 Ultra开源模型,专为长周期Agent设计,推理速度提升5倍且成本降低30%,但业界对其实际竞争力仍存疑虑。
入选理由:Nemotron 3 Ultra是面向Agent的开源模型,支持规划、推理与工具调用。
NVIDIA Nemotron 3 Ultra模型现已在OpenRouter平台免费开放,开发者可零成本调用该高性能模型进行API集成与测试。
入选理由:NVIDIA Nemotron 3 Ultra已在OpenRouter上线并标记为免费,降低高性能模型试用门槛。