NVIDIA JetPack 7.2支持内存优化的边缘智能体部署

TL;DR · AI 摘要
NVIDIA JetPack 7.2通过内存优化和agent skills实现边缘AI智能体高效部署,支持一键部署NemoClaw并减少开发时间,显著降低边缘AI系统总成本。
核心要点
- JetPack 7.2提供NemoClaw一键部署命令(curl -fsSL nvidia.com/nemoclaw.sh | bash),无需手动配置环境。
- NVIDIA agent skills包含Linux定制、内存优化和模型基准测试三类,自动化Jetson开发流程,减少开发时间。
- Jetson AGX Orin 32GB Super Mode提升边缘AI性能,实现更高成本效率,降低总拥有成本。
结构提纲
按章节快速跳转。
- §引言
NVIDIA JetPack 7.2通过内存优化和agent skills实现边缘AI智能体高效部署,加速真实世界应用。
JetPack 7.2预配置NemoClaw,支持单命令部署(curl -fsSL nvidia.com/nemoclaw.sh | bash)无需手动配置。
提供Linux定制、内存优化和模型基准测试三类技能,自动化Jetson开发流程减少开发时间。
支持Jetson Thor的MIG、Yocto Project和AGX Orin 32GB Super Mode提升性能和效率。
- §优势总结
减少开发时间,提升边缘AI性能,降低总拥有成本,加速产品上市。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- NVIDIA JetPack 7.2边缘智能体部署
- NemoClaw一键部署
- 单命令安装(curl...)
- NVIDIA agent skills
- Linux定制技能
- 内存优化技能
- 模型基准测试技能
- 新功能支持
- MIG on Thor
- Yocto Project支持
- AGX Orin 32GB Super Mode
金句 / Highlights
值得收藏与分享的关键句。
NemoClaw部署:单命令安装(curl -fsSL nvidia.com/nemoclaw.sh | bash),消除手动环境配置需求。
NVIDIA agent skills自动化Jetson开发任务,如Linux定制从数周缩短至即时,显著加速开发流程。
Jetson AGX Orin 32GB Super Mode提升边缘AI性能,实现更高成本效率,降低总拥有成本。
随着 AI agents 从数字世界走向物理环境,它们可以充分利用 NVIDIA Jetson,借助优化的内存和性能加速实际部署。
NVIDIA JetPack 7.2 直接支持 NVIDIA NemoClaw 的一键部署,这是一个为 OpenClaw 增加隐私和安全控制的开源栈。它引入了针对 Jetson 的 NVIDIA agent skills ——包括 Jetson device-side skills 和 Jetson BSP skills ——并将最新的计算栈和智能体能力扩展到 NVIDIA Jetson Orin。Jetson 软件定义平台使这一切成为可能:相同的硬件在每次软件发布中持续提供更高价值。
本文介绍了 JetPack 7.2 的新功能和能力,还包括:
- NVIDIA Multi-Instance GPU (MIG) 在 NVIDIA Jetson Thor 上支持确定性多工作负载执行
- 为自定义 Linux 发行版提供官方 Yocto Project 支持,可进一步提高系统效率
- 为 Jetson AGX Orin 32 GB 提供 Super Mode,以实现更高的 AI 性能和边缘成本效益
这些更新共同帮助开发者充分利用现有 Jetson 硬件,加速上市时间,并降低总拥有成本。

_\_图 1. JetPack 7.2 为边缘 AI 市场趋势提供优化支持\__
NVIDIA JetPack 7.2 软件如何实现智能体就绪?[](https://developer.nvidia.com/blog/deploy-agentic-ready-ai-at-the-edge-with-memory-efficiency-in-nvidia-jetpack-7-2#how_is_nvidia_jetpack_72_software_agentic-ready)
借助 JetPack 7.2,Jetson 开箱即支持 NemoClaw。JetPack 7.2 预配置了所需的依赖项和软件栈,因此您无需手动设置环境即可在 Jetson 上部署和运行基于 NemoClaw 的工作流。这使您能够轻松构建跨机器人、工业自动化、视觉智能体和边缘 AI 系统的智能体 physical AI 应用程序。
要在运行 JetPack 7.2 的 Jetson 设备上安装 NemoClaw,请运行以下单条命令:
curl -fsSL nvidia.com/nemoclaw.sh | bash
JetPack 7.2 中的 NVIDIA 智能体技能[](https://developer.nvidia.com/blog/deploy-agentic-ready-ai-at-the-edge-with-memory-efficiency-in-nvidia-jetpack-7-2#nvidia_agent_skills_for_jetson_in_jetpack_72)
JetPack 7.2 还为开发者提供了 Jetson 智能体技能,用于使用 AI 智能体构建和优化 Jetson 软件栈。智能体技能是一组可重复的、由智能体执行的指令,定义了要调用哪些工具、生成哪些输出以及如何验证结果。开发者无需手动配置开发过程的每个步骤,而是可以通过智能体利用智能体技能自动处理这些任务。
Jetson 智能体技能将此模式专门应用于 Jetson 软件开发工作流。这些由智能体驱动的工作流有助于自动化常见的开发任务,如 Jetson Linux 定制、内存优化、模型基准测试和部署配置。通过设备端和 BSP 端的实现,开发者可以使用智能体技能减少开发复杂性,并加速从原型设计到 Jetson 平台生产部署的路径。
JetPack 7.2 包含三类技能:
- Jetson Linux 定制技能: 指导智能体从头构建和定制 BSP 以用于自定义载板。这包括配置 I/O、时钟设置、风扇控制、电源配置文件或特定硬件设计的任何其他模块。以前需要数周手动努力的任务可以由智能体处理,从而减少自定义 Jetson 设计的上市时间。
- 内存优化技能: 优化软件栈中的内存使用。这些技能可以从引导加载程序内存划分开始调整整个栈,优化内核内存预留,减少冗余用户空间进程,并帮助为特定工作负载构建最内存高效的软件配置。这直接通过使更强大的工作负载能够在较低内存配置上运行来降低 TCO。
- 模型基准测试技能: 帮助您确定最适合您用例的模型配置。这些技能涵盖模型基准测试、推理优化和 Jetson 诊断。例如,构建基于 NemoClaw 应用程序的开发者可以使用这些技能确定哪个模型在其目标设备上针对特定任务运行最高效。
除了这三类技能外,NVIDIA 还引入了帮助代理构建视觉流水线的技能,使用 NVIDIA DeepStream 和 NVIDIA Metropolis Blueprint for Video Search and Summarization (VSS)。

_图 2. Jetson 代理技能推动代理开发_
要了解更多并开始使用,请查看 GitHub 上的 Jetson 设备端技能 和 Jetson BSP 技能。
Jetson Thor 上的 MIG 支持混合关键性工作负载的 GPU 分区[](https://developer.nvidia.com/blog/deploy-agentic-ready-ai-at-the-edge-with-memory-efficiency-in-nvidia-jetpack-7-2#mig_on_jetson_thor_enables_gpu_partitioning_for_mixed-criticality_workloads)
JetPack 7.2 在 Jetson Thor 上引入了对 MIG 的支持,使集成的 NVIDIA Blackwell GPU 能够被分区为两个独立的 GPU 实例,每个实例拥有专用的计算、缓存和内存带宽。这使得多个 AI 工作负载可以并发运行,具有可预测的性能和最小的干扰。
结合 JetPack 7 中的可抢占实时内核,MIG 有助于为混合关键性系统创建更确定性的执行环境。工作负载的确定性对于物理 AI 系统至关重要,例如 人形机器人、自主机器、工业自动化 和 医疗设备。这是因为感知、规划、控制、生成式 AI 和 安全 工作负载通常共享单个 SoC,资源争用可能会向时间敏感的流水线引入延迟抖动。
在 Jetson Thor 上使用 MIG,开发者可以将 GPU 资源专门分配给延迟敏感的机器人工作负载,同时在另一个分区上运行尽力而为的 AI 推理或生成式 AI 模型。这有助于为感知、传感器融合、运动规划和安全监控等工作负载保持可预测的延迟和服务质量。JetPack 7.2 在 Jetson Thor 上支持两个 MIG 分区:
- 一个用于推理、渲染、可视化和通用 NVIDIA CUDA 工作负载的更大 AI 和图形分区(12 个 SM,1536 个 CUDA 核心)
- 一个用于机器人、控制、感知或安全关键工作负载的第二个独立计算分区(8 个 SM,1024 个 CUDA 核心)
应用程序、容器和服务可以使用标准 CUDA Runtime 控制和 NVIDIA Container Toolkit 集成分配到特定的 MIG 分区。这对于在不同时间域上运行多个 AI 流水线的下一代人形机器人尤为重要,其中控制循环、AI 感知和生成式 AI 推理必须在单个嵌入式平台上可靠地共存。
通过将数据中心级 GPU 分区引入嵌入式 AI 计算,JetPack 7.2 使边缘 AI 系统更加强大,提高了在实际部署中的可预测性和可靠性。了解更多关于 Jetson Thor 上的 MIG。
介绍 NVIDIA Jetson 上的 Yocto Project 支持[](https://developer.nvidia.com/blog/deploy-agentic-ready-ai-at-the-edge-with-memory-efficiency-in-nvidia-jetpack-7-2#introducing_yocto_project_support_on_nvidia_jetson%C2%A0)
从 JetPack 7.2 开始,NVIDIA 提供官方 Jetson 上的 Yocto Project 支持,包括针对 Jetson 开发者套件的验证食谱和参考镜像。Yocto Project 是一个开源的 Linux 基金会项目,提供工具来为嵌入式硬件架构构建自定义 Linux 发行版。
NVIDIA 现在以定期发布节奏引领 OE4T 层的路线图贡献。NVIDIA 拥有 CI/CD 流水线、SQA,并为 Jetson 开发者套件发布验证参考镜像。开发者可以访问技术文档和专用论坛支持。
Yocto Project 为 Jetson 开发者带来三大核心优势:
- 可定制性: 使您能够构建紧密定制的镜像,仅包含所需的服务、驱动程序和库,而不是调整 NVIDIA Ubuntu L4T 镜像。这减少了内存占用,并针对目标应用程序优化系统性能。
- 可重现性: Yocto Project 在多次运行中生成相同的镜像构建,简化了调试、测试和认证工作流程。这在医疗和工业部署等受监管领域尤其有价值。
- 开放生态系统: 访问数千个用于 AI 框架、工业协议和自定义中间件的食谱和社区层。
要帮助您决定何时使用 L4T/JetPack 与 OE4T/Yocto Project,请参考图 3 中的开发者决策指南。

_图 3. 使用此开发者决策指南来帮助您决定何时使用 L4T/JetPack 与 OE4T/Yocto Project_
随着 Yocto Project 在 Jetson 上的官方支持,NVIDIA 还建立了一个强大的生态系统,包括发行合作伙伴、ISV 和 ODM,以加速和简化 Jetson 平台上的 Yocto Project 开发。这些合作伙伴提供多种服务,包括生产就绪的 Linux 发行版、BSP 定制、长期支持、车队管理解决方案、多媒体和 ISP 专业知识以及安全导向的集成。
像 Konsulko Group 和 Peridio 这样的公司提供完整的操作系统解决方案,如 Konsulko Orca OS 和 Avocado OS,而 Balena 则专注于基于容器的车队管理和大规模部署。其他 NVIDIA 合作伙伴包括 Neurealm、RidgeRun 和 Wind River,他们提供广泛的工程和 NRE 服务,拥有嵌入式 Linux、BSP 定制、多媒体管道和长期平台支持的深厚专业知识。通过这个生态系统,开发者可以快速部署、定制和扩展 Jetson 上的 Yocto 基础解决方案。
除了发行合作伙伴和 ISV 之外,NVIDIA 还与强大的合作伙伴生态系统紧密合作,帮助客户加速在 Jetson 平台上的产品开发和部署,例如 AAEON、Advantech、Antmicro、ASUS、AVerMedia、Connect Tech、EDOM 和 YUAN 提供各种硬件解决方案,包括载板、边缘 AI 系统、工业嵌入式平台、视频捕获解决方案和针对 Jetson 优化的参考设计。这些合作伙伴使开发者能够快速原型化和扩展生产就绪的 AI 和边缘计算解决方案,硬件平台针对机器人、工业自动化、智慧城市、医疗保健、零售和其他嵌入式 AI 应用进行了定制。
统一 Jetson 栈并释放更多性能[](https://developer.nvidia.com/blog/deploy-agentic-ready-ai-at-the-edge-with-memory-efficiency-in-nvidia-jetpack-7-2#unifying_the_jetson_stack_and_unlocking_more_performance%C2%A0)
JetPack 7.2 将基于 Ubuntu 24.04、kernel 6.8 和 CUDA Toolkit 13.0 的计算栈(随 Jetson Thor 引入)扩展到 Jetson Orin 系列,使两个平台都基于单一统一的软件基础。通过 Orin 和 Thor 之间的通用栈,您可以无缝部署整个 Jetson 产品组合中的最新 AI 应用程序,同时利用最新的 CUDA 功能、库和性能优化。
这种统一方法显著减少了支持多个硬件平台所需的工程工作量,简化了应用程序开发、验证、部署和长期车队维护。
JetPack 7.2 还为 Jetson AGX Orin 32 GB 引入了新的 Super Mode,解锁了更高的 GPU 和功率配置,使其性能更接近 Jetson AGX Orin 64 GB。通过将 GPU 频率从 930 MHz 提高到 1.3 GHz,并启用高达 60W 的更高功率包络,Super Mode 将 AI 性能从 200 TOPS 提升到 241 TOPS,比标准 AGX Orin 32 GB 配置提高了 20% 以上。
此增强使客户能够使用 Jetson AGX Orin 32 GB 实现接近旗舰级 AGX Orin 64 GB 的性能,同时将模块成本降低 45%。新的 Super Mode 使 32 GB 模块成为生成式 AI、机器人和边缘 AI 部署的经济高效选择。

_图 4. JetPack 7.2 的 Jetson AGX Orin 模块比较_

_图 5. Jetson AGX Orin 模块上的模型性能比较_
Jetson AGX Orin 32 GBJetson AGX Orin 32GB SuperJetson AGX Orin 64 GB Nemotron3 Nano 30B A3B 31 37 40 Cosmos Reason 2 8B 9 10 10 Qwen 3.5 4B 24 27 28 Qwen 3.5 9B 13 15 17 Qwen 3.6 27B 4 5 7 Gemma 4 E4B 25 29 32
_表 1. 在 Jetson AGX Orin 32 GB、Orin 32 GB Super 和 Orin 64 GB 上的生成式 AI 模型性能(以 tokens/sec 为单位)_
使用 NVIDIA JetPack 7.2 入门[](https://developer.nvidia.com/blog/deploy-agentic-ready-ai-at-the-edge-with-memory-efficiency-in-nvidia-jetpack-7-2#get_started_with_nvidia_jetpack_72%C2%A0)
JetPack 7.2 通过软件从相同的 Jetson 硬件中获得更多价值。随着智能体 AI 向边缘迁移,且在生产部署中内存成本仍然是一个实际约束,此版本直接解决了这两个问题。
功能包括:一键部署 NVIDIA NemoClaw、为 Jetson 提供的内存和工作流优化智能体技能、官方 Yocto Project 支持以实现精简且可重现的生产构建,以及在 Jetson Thor 上的 MIG 用于确定性多工作负载执行。借助 JetPack 7.2,您可以在现有硬件上完成更多任务,同时构建越来越强大的边缘智能体工作负载。
下载 JetPack 7.2 以开始在边缘部署智能体 AI。如有问题和社区支持,请访问 NVIDIA 开发者论坛。
与 NVIDIA 创始人兼 CEO 黄仁勋一起参加 NVIDIA GTC 台北 2026 主题演讲,并通过相关 会议 了解更多。