T
traeai
登录

产品

CUDA

别名:CUDA生态

NVIDIA 的并行计算平台与应用模型,广泛用于AI与高性能计算。

已跟踪 8 条高相关材料

TraeAI 观察

相关材料

已收录 8 条与 CUDA 相关的内容,按评分排序。

#567. 黄仁勋:Agent 时代普通人和企业的新生产力,AI 基础设施竞赛下的计算革命

黄仁勋在GTC Taipei 2026上宣布Agentic AI时代已到来,AI从内容生成转向自主执行任务,NVIDIA推出Vera Rubin、Vera CPU等基础设施产品,推动计算范式变革,使AI成为利润与GDP的直接生成器。

入选理由:NVIDIA发布Vera Rubin超级计算系统,专为Agent设计,支持解耦、异构和分布式AI工作负载。

精选播客#AI Agent#NVIDIA#Vera Rubin#Agentic AI#AI Infrastructure中文
Introducing NVIDIA Nemotron 3 Ultra: An Open 550B Model for Long-Running Agents

NVIDIA 推出Nemotron 3 Ultra,550B参数的开放模型,面向长时运行的智能代理,采用LatentMoE与多令牌预测,在同等推理成本下专家数提升4倍,强调速度与智能正相关,并以Open MDW许可面向企业落地。

入选理由:Nemotron 3 Ultra 为 550B 参数模型,基于与 Nemotron 3 Super 相同架构,面向长时运行的智能代理场景。

精选视频#NVIDIA#Nemotron#智能代理#LatentMoE#OpenMDW英文
Your Coding Agent Should Do AI System Engineering — Ben Burtenshaw, Hugging Face

Your Coding Agent Should Do AI System Engineering

AI Engineer4747 字 (约 19 分钟)
85

本文提出AI系统工程应由编码代理处理,通过三个渐进步骤解决硬件优化、模型训练和自动化研究,强调标准化仓库和Hugging Face Hub的重要性。

入选理由:编码代理能有效编写优化的CUDA内核,提升推理速度达30%-50%(如AMD hackathon案例)

精选视频#AI系统工程#CUDA#Hugging Face#LLM#多代理系统英文
DeepSeek V4 Flash 可以在 128GB 的 M3 Max 运行,还是 1M 上下文

DeepSeek V4 Flash 可以在 128GB 的 M3 Max 运行,还是 1M 上下文

掘金本周最热3702 字 (约 15 分钟)
85

DeepSeek V4 Flash 模型通过不对称优化和硬件特性绑定,在 128GB 内存的 M3 Max MacBook Pro 上实现了 1M 上下文的稳定运行。

入选理由:DeepSeek V4 Flash 使用不对称 2-bit 量化,仅对 MoE 专家部分进行量化,保持关键路径全精度。

精选文章#DeepSeek#MoE#量化#Apple Silicon#CUDA中文
Private, Local AI CUDA Coding Assistance on DGX Spark

DGX Spark 上私有本地 AI CUDA 编程辅助

NVIDIA Developer354 字 (约 2 分钟)
82

Nsight Copilot 可在 DGX Spark 上本地离线运行,利用 128GB 显存部署 GPT OSS 12B NIM + CUDA RAG 管道,为 CUDA 开发者提供隐私安全、零云成本的 AI 编程辅助。

入选理由:Nsight Copilot 支持在 DGX Spark(128GB 显存)上本地部署 GPT OSS 12B NIM + CUDA RAG 管道,实现完全离线运行。

精选视频#CUDA#AI 编程助手#NVIDIA#本地大模型#DGX Spark英文
CUDA Proves Nvidia Is a Software Company

CUDA证明NVIDIA是一家软件公司

Wired AI757 字 (约 4 分钟)
75

文章分析了CUDA如何证明NVIDIA是一家软件公司,强调其在GPU计算生态中的软件战略地位。

入选理由:CUDA是NVIDIA构建软件生态的核心工具

精选文章#CUDA#NVIDIA#软件生态中文
Mixpanel 创始人 @Suhail 提出了一个对于美国 AI 公司们很实现的问题:

当中国在浮点运算层面的算力实现独立后,他们的开源贡献会逐渐迁移到一套美国 "用不了、也不能用" 的技术栈上。...

Mixpanel 创始人 @Suhail 提出了一个对于美国 AI 公司们很实现的问题

meng shao(@shao__meng)498 字 (约 2 分钟)
65

中国在浮点运算算力上的独立将导致其开源生态转向美国无法使用的技术栈,对美国AI研究和基础设施构成挑战。

入选理由:中国算力独立后,开源贡献可能转向美国无法使用的技术栈

精选推文#AI#算力#开源#中美科技#技术栈中英混合

跨材料问答 · CUDA

回答基于:CUDA 相关 8 条材料
    0 / 500

    AI 可能会生成不准确的信息,请核实重要内容