Nvidia AI PC、Project Solara与微软AI战略评析
TL;DR · AI 摘要
Nvidia RTX Spark芯片因重GPU轻CPU的设计难以胜任2026年Agentic AI时代的本地推理需求。Ben Thompson指出,当前AI Agent依赖强CPU与云端协同,而该芯片牺牲CPU性能换取GPU规模,仅适合2023年聊天机器人场景,在Windows on ARM生态下性价比存疑。
核心要点
- RTX Spark配备20核Arm CPU、6144 CUDA核心及128GB内存,但解码速度低于M5 Max。
- Agentic AI时代本地Agent需强CPU性能+云端推理,而非单纯堆砌本地GPU算力。
- Windows on ARM的软件兼容性问题使RTX Spark在2026年面临实际使用妥协风险。
结构提纲
按章节快速跳转。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- Nvidia RTX Spark评估
- 硬件架构
- 20核Arm CPU + Blackwell GPU
- 128GB LPDDR5X统一内存
- 时代错配
- Agentic AI需强CPU+云协同
- GPU堆料牺牲CPU性能
- 生态风险
- Windows on ARM兼容性差
- 2026年性价比存疑
金句 / Highlights
值得收藏与分享的关键句。
RTX Spark将大量芯片面积用于GPU核心,但其性能仍逊于云端,且以牺牲CPU为代价。
本地Agent的理想配置是强大的本地CPU性能加上云端推理调用。
考虑到Windows on ARM的现实软件妥协,很难认为它在2026年物有所值。
标题:Nvidia AI PC、Project Solara 与 Microsoft AI
URL 来源:https://stratechery.com/2026/the-nvidia-ai-pc-project-solara-microsoft-ai/
发布时间:2026-06-03T10:00:00+00:00
Markdown 内容: 收听本期节目:
早上好,
我通常不会提前透露采访对象,但鉴于本周的主题以及下方的 Update 内容,我决定破例一次。此刻我正在旧金山撰写本文,此前在微软 CEO Satya Nadella 发表 Build 开发者大会主题演讲后,我对他进行了专访。按照惯例,我会希望立即发布这篇访谈,以便大家能结合完整背景来理解我的分析。
然而这一次,我在主题演讲期间、也就是采访开始之前,就已经形成了下文中的观点。因此(也出于一些流程安排上的考虑),我希望先阐述这些想法(让大家在看到我的提问之前有所了解),然后再跟进 Nadella 对这些话题(以及其他诸多议题)的看法。
言归正传,以下是本期 Update:
Nvidia AI PC
据 CNBC 报道:
Nvidia 凭借在数据中心人工智能芯片市场的主导地位,已成为全球市值最高的公司。如今,该公司正将其技术优势扩展至个人电脑主处理器领域,进军这个长期由 Intel、AMD、Qualcomm 和 Apple 主导的市场。
在周一于台湾举行的 Computex 展会主题演讲中,Nvidia CEO 黄仁勋发布了与微软联合打造的全新 PC 处理器。这款名为 RTX Spark 的超级芯片(黄仁勋也称其为 N1X)将于今年秋季首发,搭载于来自微软、Dell、HP、ASUS、Lenovo 和 MSI 的全新一代 Windows PC 产品线中。
实际上,我的行程从周日的台北就开始了,当时黄仁勋介绍了这款传闻已久的 Nvidia PC 芯片;根据 Tom’s Hardware 的报道:
在满血规格下,该芯片提供多达 20 个 Arm CPU 核心、拥有 6,144 个 CUDA 核心的 Blackwell GPU、128GB LPDDR5X 内存,以及高达 300 GB/s 的内存带宽。Nvidia 表示,通过 NVLink C2C 互联的强大 CPU 和 GPU,加上大容量内存池,可为 AI Agent 和 1200 亿参数模型提供充足的算力和空间,支持上下文长度达百万 token 的长时间运行任务。
目前我们还没有任何基准测试数据,但 RTX Spark 看起来与 DGX Spark 大致相似;后者是一款不错的芯片,在 prefill 阶段表现出色,但由于内存带宽较低,decode 速度不及 M5 Max,而在 CPU 任务上则明显更慢。
黄仁勋在主题演讲中通过视频连线现身,讨论了这款芯片。
Satya Nadella: 突然间,“边缘端无限算力”这个概念又变得炙手可热。也许你可以稍微谈谈这一点:你一直在思考和讨论这个话题,而现在随着 RTX Spark 的真正落地,我认为这为 AI 的广泛普及带来了一个突破性的系统。Jensen,能否分享一下你对这一发展趋势的愿景?
黄仁勋: 这一切大约始于三年前你我之间的一次对话。当时我们在探讨如何打造一类全新的 PC,既能为设计师和创作者提供卓越体验,又能完美支持人工智能。这类系统不仅需要具备强大的处理能力,还需要集成到全球各类设计和创作软件中的完整软件栈,当然还包括我们在 AI 领域所做的所有工作。三年后的今天,我们打造出了一款令人惊叹的全新芯片。该系统得到了你为 Windows 开发的所有新软件的支持。现在,我们基本上已经能够在 PC 上运行自主 Agent 了。
这段对话解释了为什么我觉得这款特定的芯片乃至整个 AI PC 概念都相当令人失望。三年前我们还处于 AI 的 ChatGPT 时代,当时我对本地推理的可能性感到非常兴奋。随后进入了推理(reasoning)时代,KV cache 急剧膨胀(增加了对更大内存的需求),同时 decode 的重要性也日益凸显(因为需要生成更多的 token)。而现在我们已步入 Agentic 时代,CPU 性能变得至关重要。
就此而言,本地 Agent 的理想配置应该是强劲的本地 CPU 性能,并将推理任务交由云端处理。然而,RTX Spark 却将大量芯片面积花在了 GPU 核心上——这些核心无论如何(至少在内存容量和带宽方面)都无法与云端相提并论——反而牺牲了 CPU 性能。如果你只是想要一个 2023 年水平的聊天机器人,这款芯片或许够用;但在 2026 年,很难说它是否物有所值——更何况还要承受 Windows on ARM 在软件兼容性方面不得不做出的妥协。
把时间快进到 Build 大会的主题演讲,坦白说,开场部分让我觉得颇为乏味。Nadella 先是简要概述了 AI 技术栈,然后开始谈论 Windows,说实话,他对这部分内容表现出的愿景缺失和热情不足让我感到惊讶。就在那时我突然意识到:Nadella 的想法可能和我一样!诚然,具备一定的本地推理能力固然不错,但那并非真正重要的 AI 未来的发展方向。
要知道,Nadella 对 Windows 并没有真正的执念;事实上,正是他促成了我所写的《Windows 的终结》一文中的局面。准确地说,Nadella 并没有终结 Windows 这款产品,但他终结了 Windows 作为全公司运营核心组织原则的时代,转而专注于跨平台运行的软件和承载一切的云服务。
由此引出了一个出人意料的结论,也是本次 Build 主题演讲中最耐人寻味的部分:如果微软实际上正处于重返 AI 设备领域的有利位置呢?
Project Solara
据 GeekWire 报道:
微软内部的一个团队一直在悄然构建一个专为运行 AI Agent 而非传统应用而设计的设备平台。该平台基于 Android 而非 Windows 系统,目前已完成两款可工作的硬件设计,并已与一批知名企业达成初步试点合作。这个名为“Project Solara”的平台,寄托了微软的愿景:AI 将开启全新的计算场景——通过 Agent 突破传统软件的局限,并利用现成组件快速、低成本地开发新型设备。
需要明确的是,Project Solara 目前仍处于概念阶段,尽管微软已展示了实体设备,并成功签约高通和联发科作为芯片合作伙伴。但这一构想确实极具吸引力。以下是纳德拉(Nadella)对该项目的介绍:
到目前为止,我们一直在讨论边缘计算和云计算,以及现有的设备形态,对吧?当我看到黄仁勋周末那张摆满台式机的照片时,我不禁感叹:天哪,我仿佛回到了 90 年代!因为看到那些伴随我成长、曾让我爱不释手的机器再次以全新功能回归,实在太酷了。设备形态依旧,但由于板载 AI 能力的加持,其功能已实现了惊人的飞跃。这正是我们在笔记本电脑、台式机乃至云端所见证的变革。
但这同时也引出了下一个问题:既然你拥有了这种全新的功能,并能将其融入现有设备形态中,那么你是否能为这些新功能量身打造全新的设备形态?甚至为 Agent 时代构建一个全新的平台?这正是我们今天推出 Project Solara 的初衷。
首先,请注意其中的叙事框架:PC 不过是搭载了 Agent 的旧技术;那么由 Agent 催生的独有新技术又是什么?同时也要注意微软一贯的经典思路:这项新技术能否建立在一个新平台之上?微软应用科学集团负责人、公司副总裁 Steve Bathiche 阐述了这一愿景:
在介绍大家刚刚看到的那些令人惊叹的新设备之前,我想先谈谈背后的原因。早在 Build 2023 大会上,我就曾提到过一种外向型 AI 应用架构:AI 不再局限于单个应用内部运行,而是走向全局,跨越多个应用和服务进行连接、协调,并在整个工作流、各类设备以及不同时间跨度上保持上下文连贯。如果有一个设备生态系统专门为这种新型应用架构、这类 Agent 以及这种变革性的交互技术而设计,那会怎样?这正是 Project Solara 诞生的原动力。
但在众多可能的形态中,该如何抉择?下一代设备究竟是什么?我们的重大顿悟在于:关键不在于选择某一种特定的设备形态,而在于构建一个系统,让你的 Agent 能够跨越多台设备协同运作。下一代计算机并非单一设备,而是所有这些设备作为一个整体系统协同工作,让 Agent 在你需要的时间和地点触手可及。
在 Bathiche 出场前的宣传视频中,有一个短暂的瞬间让我对这个概念豁然开朗:
可穿戴设备的痛点在于其交互模式:只有当你主动与其交互、即人类介入流程时,它们才有用;但频繁地与可穿戴设备互动既烦人又低效。然而,这里所展示的却是一种简短的交互,随后 Agent 便在后台自动完成任务。换句话说,实际的工作负载在云端完成,无需人类持续参与,因为 Agent 正在代为执行。
这正是我认为其引人入胜之处。一方面,人们当然可以说,鉴于微软并不掌控像 iPhone 这样的移动设备,它自然会对这种以云为平台的设备模式感兴趣。但我意识到的是,即便 Project Solara 未能成功,这种模式——即以云端为中心枢纽、多种设备为辐射节点,而非以手机为核心——显然更适合 Agent。Agent 在云端以及跨应用、跨设备的场景中才能发挥最大效能;没错,手机可以是这些设备之一,但在 Agent 时代,它不应再占据中心枢纽的位置。
再次强调,这仍是尚未落地的概念产品,且高度契合微软自身的利益,因此对 Project Solara 应保持审慎态度。然而,这一未来愿景确实合乎逻辑,尤其是在企业级场景中——所有的上下文信息和算力本就集中在云端(Project Solara 也明确聚焦于企业市场,而非消费者市场)。这也与过往的模式截然不同,印证了我的观点:在 AI 时代,轻量化才是王道。
Microsoft AI
据 GeekWire 报道:
微软的 AI 业务此前主要依赖 OpenAI 的模型,近期才扩展至 Anthropic。而在周二,该公司展示了其减少对这两家供应商依赖的计划。在 Build 开发者大会上,微软 AI 超级智能团队发布了从零开始构建的七款自研模型系列。这是微软持续努力的一部分,旨在打造可靠的内部替代方案,以应对来自合作伙伴及竞争对手的模型……
在这七款新发布的 MAI 模型中,旗舰产品是推理模型 MAI-Thinking-1。微软表示,该模型在盲测中的人类评估表现与 Anthropic 的 Claude Sonnet 4.6 持平,并在广泛使用的代码基准测试中匹配了性能更强的 Claude Opus 4.6。[微软 AI CEO Mustafa] Suleyman 强调,MAI-Thinking-1 完全从头训练,未使用任何其他公司的模型进行蒸馏,此举意在吸引那些重视数据来源纯净度的企业客户。
综合考虑,这些模型看起来相当不错,但真正引起我兴趣的是其定位:微软强调企业可以将这些模型据为己有,打造专属能力。Suleyman 表示:
这就是拥有全栈端到端能力的真实写照。它是 Microsoft Frontier Tuning 的基石,让您能够利用我们的全栈爬坡优化引擎(hill climbing machine),在您需要的位置对 MAI 模型进行定制。这意味着,我们在构建模型过程中所投入的那种严谨且不懈的工程努力,现在可以通过一个值得信赖的平台开放给各位;该平台将代表您运行,助您创建完全由您掌控的自定义智能体。
当然,过去一年中发生的真正重大突破是 RLE(强化学习环境)的推出——这是专为您的 AI 打造的独特训练场。它们基于 MAI 模型,能够构建出仅适配于您、针对特定公司和任务的智能体。例如,在微软内部,我们将 RLE 与 MAI 模型结合使用,不断优化以探索 Excel 中最佳的智能体应用场景。经 MAI 调优后的模型在公开及私有基准测试中的表现已媲美 GPT-5.4,同时成本效率提升了 10 倍,许多其他早期采用者也取得了类似的成果。当我们针对麦肯锡的任务对模型进行微调时,MAI 取得了最高的胜率,甚至超越了 GPT-5.5,并且同样实现了 10 倍的成本效率提升。因此,在我们看来,这正是经过精心校准的前沿微调所带来的优势。
更重要的是,与其他一些公司不同,使用 MAI 意味着您无需从一个向所有人学习、供所有人共享的模型那里“租用”智能。只有您能独享通过辛勤积累的工作流、专有技术、知识以及机构数据所带来的收益。只有您能完全掌控最终生成的模型。因此,与我们合作,您在 RLE 中构建的环境及模型将成为您的护城河。我真心认为这是独树一帜的。这标志着 AI 新时代的到来,我们都对此感到无比振奋。
这与 AWS 的 Nova Forge 服务颇有几分相似,后者允许企业在预训练的某个检查点注入自有数据;两者的区别在于微软更侧重于强化学习,但这些界限正日益模糊。
其核心理念在于,企业可以基于自有数据拥有专属模型,而无需与那些意图抢占其市场份额的前沿实验室共享数据。这一概念在理论上无疑极具吸引力;真正的考验在于,选择这条路线的企业是否会因未能处于功能最前沿而处于劣势。不过话说回来,帮助谨慎的企业按照自己的节奏拥抱未来,而不必单纯依靠极致性能取胜,这正是微软长期以来稳固其市场地位的制胜之道。
- * *
本期 Update 将于今天晚些时候以播客形式上线。若想在您的播客播放器中收听,请访问 Stratechery。
Stratechery Update 仅供单一订阅者阅读,但偶尔转发给他人完全没问题!如果您希望为团队订购多个订阅并享受团体折扣(最少 5 个),请直接与我联系。
感谢您的订阅,祝您度过美好的一天!