T
traeai
登录
返回首页
Stratechery

Nvidia AI PC、Project Solara与微软AI战略评析

8.2Score

TL;DR · AI 摘要

Nvidia RTX Spark芯片因重GPU轻CPU的设计难以胜任2026年Agentic AI时代的本地推理需求。Ben Thompson指出,当前AI Agent依赖强CPU与云端协同,而该芯片牺牲CPU性能换取GPU规模,仅适合2023年聊天机器人场景,在Windows on ARM生态下性价比存疑。

核心要点

  • RTX Spark配备20核Arm CPU、6144 CUDA核心及128GB内存,但解码速度低于M5 Max。
  • Agentic AI时代本地Agent需强CPU性能+云端推理,而非单纯堆砌本地GPU算力。
  • Windows on ARM的软件兼容性问题使RTX Spark在2026年面临实际使用妥协风险。

结构提纲

按章节快速跳转。

  1. §Nvidia AI PC战略背景

    Nvidia联合微软推出RTX Spark芯片,旨在将数据中心AI优势扩展至个人电脑市场。

  2. 该芯片集成20核Arm CPU、Blackwell GPU及128GB统一内存,支持百万token上下文本地运行。

  3. Agentic AI时代的技术错配

    当前AI Agent依赖高CPU性能与云端协同,RTX Spark重GPU轻CPU设计不符合2026年技术趋势。

  4. ·Windows on ARM生态制约

    软件兼容性妥协使RTX Spark在实际应用中难以发挥理论性能,降低产品竞争力。

思维导图

用一张图看清主题之间的关系。

查看大纲文本(无障碍 / 无 JS 友好)
  • Nvidia RTX Spark评估
    • 硬件架构
      • 20核Arm CPU + Blackwell GPU
      • 128GB LPDDR5X统一内存
    • 时代错配
      • Agentic AI需强CPU+云协同
      • GPU堆料牺牲CPU性能
    • 生态风险
      • Windows on ARM兼容性差
      • 2026年性价比存疑

金句 / Highlights

值得收藏与分享的关键句。

#AI PC#Nvidia#Agentic AI#Windows on ARM#边缘计算
打开原文

标题:Nvidia AI PC、Project Solara 与 Microsoft AI

URL 来源:https://stratechery.com/2026/the-nvidia-ai-pc-project-solara-microsoft-ai/

发布时间:2026-06-03T10:00:00+00:00

Markdown 内容: 收听本期节目:

早上好,

我通常不会提前透露采访对象,但鉴于本周的主题以及下方的 Update 内容,我决定破例一次。此刻我正在旧金山撰写本文,此前在微软 CEO Satya Nadella 发表 Build 开发者大会主题演讲后,我对他进行了专访。按照惯例,我会希望立即发布这篇访谈,以便大家能结合完整背景来理解我的分析。

然而这一次,我在主题演讲期间、也就是采访开始之前,就已经形成了下文中的观点。因此(也出于一些流程安排上的考虑),我希望先阐述这些想法(让大家在看到我的提问之前有所了解),然后再跟进 Nadella 对这些话题(以及其他诸多议题)的看法。

言归正传,以下是本期 Update:

Nvidia AI PC

CNBC 报道:

Nvidia 凭借在数据中心人工智能芯片市场的主导地位,已成为全球市值最高的公司。如今,该公司正将其技术优势扩展至个人电脑主处理器领域,进军这个长期由 Intel、AMD、Qualcomm 和 Apple 主导的市场。

在周一于台湾举行的 Computex 展会主题演讲中,Nvidia CEO 黄仁勋发布了与微软联合打造的全新 PC 处理器。这款名为 RTX Spark 的超级芯片(黄仁勋也称其为 N1X)将于今年秋季首发,搭载于来自微软、Dell、HP、ASUS、Lenovo 和 MSI 的全新一代 Windows PC 产品线中。

实际上,我的行程从周日的台北就开始了,当时黄仁勋介绍了这款传闻已久的 Nvidia PC 芯片;根据 Tom’s Hardware 的报道:

在满血规格下,该芯片提供多达 20 个 Arm CPU 核心、拥有 6,144 个 CUDA 核心的 Blackwell GPU、128GB LPDDR5X 内存,以及高达 300 GB/s 的内存带宽。Nvidia 表示,通过 NVLink C2C 互联的强大 CPU 和 GPU,加上大容量内存池,可为 AI Agent 和 1200 亿参数模型提供充足的算力和空间,支持上下文长度达百万 token 的长时间运行任务。

目前我们还没有任何基准测试数据,但 RTX Spark 看起来与 DGX Spark 大致相似;后者是一款不错的芯片,在 prefill 阶段表现出色,但由于内存带宽较低,decode 速度不及 M5 Max,而在 CPU 任务上则明显更慢。

黄仁勋在主题演讲中通过视频连线现身,讨论了这款芯片。

Satya Nadella: 突然间,“边缘端无限算力”这个概念又变得炙手可热。也许你可以稍微谈谈这一点:你一直在思考和讨论这个话题,而现在随着 RTX Spark 的真正落地,我认为这为 AI 的广泛普及带来了一个突破性的系统。Jensen,能否分享一下你对这一发展趋势的愿景?

黄仁勋: 这一切大约始于三年前你我之间的一次对话。当时我们在探讨如何打造一类全新的 PC,既能为设计师和创作者提供卓越体验,又能完美支持人工智能。这类系统不仅需要具备强大的处理能力,还需要集成到全球各类设计和创作软件中的完整软件栈,当然还包括我们在 AI 领域所做的所有工作。三年后的今天,我们打造出了一款令人惊叹的全新芯片。该系统得到了你为 Windows 开发的所有新软件的支持。现在,我们基本上已经能够在 PC 上运行自主 Agent 了。

这段对话解释了为什么我觉得这款特定的芯片乃至整个 AI PC 概念都相当令人失望。三年前我们还处于 AI 的 ChatGPT 时代,当时我对本地推理的可能性感到非常兴奋。随后进入了推理(reasoning)时代,KV cache 急剧膨胀(增加了对更大内存的需求),同时 decode 的重要性也日益凸显(因为需要生成更多的 token)。而现在我们已步入 Agentic 时代,CPU 性能变得至关重要。

就此而言,本地 Agent 的理想配置应该是强劲的本地 CPU 性能,并将推理任务交由云端处理。然而,RTX Spark 却将大量芯片面积花在了 GPU 核心上——这些核心无论如何(至少在内存容量和带宽方面)都无法与云端相提并论——反而牺牲了 CPU 性能。如果你只是想要一个 2023 年水平的聊天机器人,这款芯片或许够用;但在 2026 年,很难说它是否物有所值——更何况还要承受 Windows on ARM 在软件兼容性方面不得不做出的妥协。

把时间快进到 Build 大会的主题演讲,坦白说,开场部分让我觉得颇为乏味。Nadella 先是简要概述了 AI 技术栈,然后开始谈论 Windows,说实话,他对这部分内容表现出的愿景缺失和热情不足让我感到惊讶。就在那时我突然意识到:Nadella 的想法可能和我一样!诚然,具备一定的本地推理能力固然不错,但那并非真正重要的 AI 未来的发展方向。

要知道,Nadella 对 Windows 并没有真正的执念;事实上,正是他促成了我所写的《Windows 的终结》一文中的局面。准确地说,Nadella 并没有终结 Windows 这款产品,但他终结了 Windows 作为全公司运营核心组织原则的时代,转而专注于跨平台运行的软件和承载一切的云服务。

由此引出了一个出人意料的结论,也是本次 Build 主题演讲中最耐人寻味的部分:如果微软实际上正处于重返 AI 设备领域的有利位置呢?

Project Solara

GeekWire 报道:

微软内部的一个团队一直在悄然构建一个专为运行 AI Agent 而非传统应用而设计的设备平台。该平台基于 Android 而非 Windows 系统,目前已完成两款可工作的硬件设计,并已与一批知名企业达成初步试点合作。这个名为“Project Solara”的平台,寄托了微软的愿景:AI 将开启全新的计算场景——通过 Agent 突破传统软件的局限,并利用现成组件快速、低成本地开发新型设备。

需要明确的是,Project Solara 目前仍处于概念阶段,尽管微软已展示了实体设备,并成功签约高通和联发科作为芯片合作伙伴。但这一构想确实极具吸引力。以下是纳德拉(Nadella)对该项目的介绍:

到目前为止,我们一直在讨论边缘计算和云计算,以及现有的设备形态,对吧?当我看到黄仁勋周末那张摆满台式机的照片时,我不禁感叹:天哪,我仿佛回到了 90 年代!因为看到那些伴随我成长、曾让我爱不释手的机器再次以全新功能回归,实在太酷了。设备形态依旧,但由于板载 AI 能力的加持,其功能已实现了惊人的飞跃。这正是我们在笔记本电脑、台式机乃至云端所见证的变革。

但这同时也引出了下一个问题:既然你拥有了这种全新的功能,并能将其融入现有设备形态中,那么你是否能为这些新功能量身打造全新的设备形态?甚至为 Agent 时代构建一个全新的平台?这正是我们今天推出 Project Solara 的初衷。

首先,请注意其中的叙事框架:PC 不过是搭载了 Agent 的旧技术;那么由 Agent 催生的独有新技术又是什么?同时也要注意微软一贯的经典思路:这项新技术能否建立在一个新平台之上?微软应用科学集团负责人、公司副总裁 Steve Bathiche 阐述了这一愿景:

在介绍大家刚刚看到的那些令人惊叹的新设备之前,我想先谈谈背后的原因。早在 Build 2023 大会上,我就曾提到过一种外向型 AI 应用架构:AI 不再局限于单个应用内部运行,而是走向全局,跨越多个应用和服务进行连接、协调,并在整个工作流、各类设备以及不同时间跨度上保持上下文连贯。如果有一个设备生态系统专门为这种新型应用架构、这类 Agent 以及这种变革性的交互技术而设计,那会怎样?这正是 Project Solara 诞生的原动力。

但在众多可能的形态中,该如何抉择?下一代设备究竟是什么?我们的重大顿悟在于:关键不在于选择某一种特定的设备形态,而在于构建一个系统,让你的 Agent 能够跨越多台设备协同运作。下一代计算机并非单一设备,而是所有这些设备作为一个整体系统协同工作,让 Agent 在你需要的时间和地点触手可及。

在 Bathiche 出场前的宣传视频中,有一个短暂的瞬间让我对这个概念豁然开朗:

可穿戴设备的痛点在于其交互模式:只有当你主动与其交互、即人类介入流程时,它们才有用;但频繁地与可穿戴设备互动既烦人又低效。然而,这里所展示的却是一种简短的交互,随后 Agent 便在后台自动完成任务。换句话说,实际的工作负载在云端完成,无需人类持续参与,因为 Agent 正在代为执行。

这正是我认为其引人入胜之处。一方面,人们当然可以说,鉴于微软并不掌控像 iPhone 这样的移动设备,它自然会对这种以云为平台的设备模式感兴趣。但我意识到的是,即便 Project Solara 未能成功,这种模式——即以云端为中心枢纽、多种设备为辐射节点,而非以手机为核心——显然更适合 Agent。Agent 在云端以及跨应用、跨设备的场景中才能发挥最大效能;没错,手机可以是这些设备之一,但在 Agent 时代,它不应再占据中心枢纽的位置。

再次强调,这仍是尚未落地的概念产品,且高度契合微软自身的利益,因此对 Project Solara 应保持审慎态度。然而,这一未来愿景确实合乎逻辑,尤其是在企业级场景中——所有的上下文信息和算力本就集中在云端(Project Solara 也明确聚焦于企业市场,而非消费者市场)。这也与过往的模式截然不同,印证了我的观点:在 AI 时代,轻量化才是王道

Microsoft AI

GeekWire 报道:

微软的 AI 业务此前主要依赖 OpenAI 的模型,近期才扩展至 Anthropic。而在周二,该公司展示了其减少对这两家供应商依赖的计划。在 Build 开发者大会上,微软 AI 超级智能团队发布了从零开始构建的七款自研模型系列。这是微软持续努力的一部分,旨在打造可靠的内部替代方案,以应对来自合作伙伴及竞争对手的模型……

在这七款新发布的 MAI 模型中,旗舰产品是推理模型 MAI-Thinking-1。微软表示,该模型在盲测中的人类评估表现与 Anthropic 的 Claude Sonnet 4.6 持平,并在广泛使用的代码基准测试中匹配了性能更强的 Claude Opus 4.6。[微软 AI CEO Mustafa] Suleyman 强调,MAI-Thinking-1 完全从头训练,未使用任何其他公司的模型进行蒸馏,此举意在吸引那些重视数据来源纯净度的企业客户。

综合考虑,这些模型看起来相当不错,但真正引起我兴趣的是其定位:微软强调企业可以将这些模型据为己有,打造专属能力。Suleyman 表示:

这就是拥有全栈端到端能力的真实写照。它是 Microsoft Frontier Tuning 的基石,让您能够利用我们的全栈爬坡优化引擎(hill climbing machine),在您需要的位置对 MAI 模型进行定制。这意味着,我们在构建模型过程中所投入的那种严谨且不懈的工程努力,现在可以通过一个值得信赖的平台开放给各位;该平台将代表您运行,助您创建完全由您掌控的自定义智能体。

当然,过去一年中发生的真正重大突破是 RLE(强化学习环境)的推出——这是专为您的 AI 打造的独特训练场。它们基于 MAI 模型,能够构建出仅适配于您、针对特定公司和任务的智能体。例如,在微软内部,我们将 RLE 与 MAI 模型结合使用,不断优化以探索 Excel 中最佳的智能体应用场景。经 MAI 调优后的模型在公开及私有基准测试中的表现已媲美 GPT-5.4,同时成本效率提升了 10 倍,许多其他早期采用者也取得了类似的成果。当我们针对麦肯锡的任务对模型进行微调时,MAI 取得了最高的胜率,甚至超越了 GPT-5.5,并且同样实现了 10 倍的成本效率提升。因此,在我们看来,这正是经过精心校准的前沿微调所带来的优势。

更重要的是,与其他一些公司不同,使用 MAI 意味着您无需从一个向所有人学习、供所有人共享的模型那里“租用”智能。只有您能独享通过辛勤积累的工作流、专有技术、知识以及机构数据所带来的收益。只有您能完全掌控最终生成的模型。因此,与我们合作,您在 RLE 中构建的环境及模型将成为您的护城河。我真心认为这是独树一帜的。这标志着 AI 新时代的到来,我们都对此感到无比振奋。

这与 AWS 的 Nova Forge 服务颇有几分相似,后者允许企业在预训练的某个检查点注入自有数据;两者的区别在于微软更侧重于强化学习,但这些界限正日益模糊。

其核心理念在于,企业可以基于自有数据拥有专属模型,而无需与那些意图抢占其市场份额的前沿实验室共享数据。这一概念在理论上无疑极具吸引力;真正的考验在于,选择这条路线的企业是否会因未能处于功能最前沿而处于劣势。不过话说回来,帮助谨慎的企业按照自己的节奏拥抱未来,而不必单纯依靠极致性能取胜,这正是微软长期以来稳固其市场地位的制胜之道。

  • * *

本期 Update 将于今天晚些时候以播客形式上线。若想在您的播客播放器中收听,请访问 Stratechery

Stratechery Update 仅供单一订阅者阅读,但偶尔转发给他人完全没问题!如果您希望为团队订购多个订阅并享受团体折扣(最少 5 个),请直接与我联系。

感谢您的订阅,祝您度过美好的一天!

AI 可能会生成不准确的信息,请核实重要内容