欢迎 NVIDIA Cosmos 3:首个用于物理AI推理与行动的开源全能模型
NVIDIA Cosmos 3 是首个开源物理AI全能模型,整合世界生成、物理推理与动作生成于单模型,支持机器人、自动驾驶等场景,基于MoT架构并提供Hugging Face集成。
入选理由:Cosmos 3 是首个统一物理AI能力的开源模型,融合世界生成、物理推理与动作生成于单模型。
公司
别名:huggingface
AI模型托管与开源社区平台。
已跟踪 30 条高相关材料
最近变化
2026-06-04 · 推文仅含Hugging Face数据集nanoclaw-traces链接,无技术说明或使用方法。
为什么值得关注
Hugging Face 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。
Welcome NVIDIA Cosmos 3: The First Open Omni-model for Physical AI Reasoning and Action
Hugging Face Blog · 9.2 分
NVIDIA Cosmos 3 是首个开源的物理AI全能模型,整合世界生成、物理推理与动作生成于单一架构,支持机器人、自动驾驶等场景,基于MoT混合Transformer架构,提供Hugging Face模型卡与Diffusers集成。
Introducing Mellum2: A 12B Mixture-of-Experts Model by JetBrains
Hugging Face Blog · 9 分
JetBrains 发布 12B MoE 架构模型 Mellum2,每 token 仅激活 2.5B 参数,推理速度超同类模型 2 倍以上,专为代码与文本任务优化,支持私有部署和 RAG 等高频低延迟场景。
Gemma-4 12B + Hermes,Google AI Edge: EASY, GOOD & LOCAL!
AICodeKing · 8.7 分
Gemma-4 12B 是无需编码器的统一多模态模型,直连 LLM,可在消费级 16GB 设备本地运行,性能接近 26B MOE 且内存占用不足其一半,配套 Hermes 等 Agent 工具与 macOS Edge Gallery,开源 Apache 2.0。
已收录 30 条与 Hugging Face 相关的内容,按评分排序。
NVIDIA Cosmos 3 是首个开源物理AI全能模型,整合世界生成、物理推理与动作生成于单模型,支持机器人、自动驾驶等场景,基于MoT架构并提供Hugging Face集成。
入选理由:Cosmos 3 是首个统一物理AI能力的开源模型,融合世界生成、物理推理与动作生成于单模型。
JetBrains 发布 12B MoE 架构模型 Mellum2,每 token 仅激活 2.5B 参数,推理速度超同类模型 2 倍以上,专为代码与文本任务优化,支持私有部署和 RAG 等高频低延迟场景。
入选理由:Mellum2 是 12B 参数 MoE 模型,每 token 仅激活 2.5B 参数,推理效率提升 2x+,适合高吞吐生产环境。
Gemma-4 12B 采用统一无编码器架构,图像与音频直连 LLM,可在 16GB 设备本地运行;性能接近 26B MOE 且内存不足其半,配套 Hermes 等 Agent 工具与 macOS Edge Gallery,采用 Apache 2.0 开源许可。
入选理由:Gemma-4 12B 无需分别的视觉/音频编码器,图像与音频直接映射到 LLM,减少延迟与内存开销。
Gemma 4 12B 是面向本机运行的统一、无编码器多模态模型,将视觉与音频直接接入 LLM,性能接近 26B MoE 但内存仅其一半,可在 16GB VRAM 紧凑设备上运行,支持离线语音处理与低延迟多步推理。
入选理由:Gemma 4 12B 性能接近 26B MoE,内存仅其一半,适合在 16GB VRAM 现代本机运行。
Hugging Face 推出 MCP 工具集成,使 Reachy Mini 机器人可通过 MCP 协议调用 Hugging Face Spaces 上的远程工具,如天气查询和网页搜索,无需修改本地应用代码,工具在云端运行,支持用户自定义发布工具,只需一条命令即可添加新能力,如询问巴黎今日天气。
入选理由:通过一条命令即可添加 MCP 工具:`reachy-mini-conversation-app tool-spaces add pollen-robotics/reachy-mini-weather-tool`,工具在云端运行,无需下载代码到本地机器。
Holo3.1 是 Hugging Face 推出的全新计算机使用代理模型,支持跨桌面、移动端与多框架部署,并首次提供 FP8/Q4 GGUF/NVFP4 量化权重以实现本地高效推理。
入选理由:Holo3.1 在 AndroidWorld 上 35B-A3B 模型准确率从 67% 提升至 79.3%
Mellum2是JetBrains开源的12B参数AI模型,采用MoE架构使每token仅激活2.5B参数,推理速度比同类模型快50%,专为软件工程环境设计,适用于路由、RAG管道和私有AI部署等场景。
入选理由:Mellum2采用MoE架构,12B参数模型每token仅激活2.5B参数,推理速度比同类模型快50%,显著降低生产环境延迟和成本
Lelab 是一个图形化机器人控制平台,可实现零代码配置、数据采集与模型训练。
入选理由:通过简单界面完成机器人配置、校准及摄像头添加,零代码门槛。
NVIDIA的合成数据生成代理可将视觉检测数据收集时间从数月压缩至几小时,通过自然语言提示自动生成PCB、玻璃和金属缺陷图像,显著提升模型训练效率。
入选理由:使用NVIDIA Physical AI Agent,输入自然语言提示如'PCB桥接缺陷'即可生成缺陷图像,单图生成耗时约10分钟。
该论文提出了一种利用语言模型预测 GPU 内核运行时性能的新方法,实验表明其在多个基准测试中优于传统方法。
入选理由:论文提出 GPU Forecasters 方法,使用语言模型预测 GPU 内核性能。
开源模型MiniMax M3已达到与GPT-5.5和Opus 4.7相当的性能,尤其在编码任务上优于Gemini 3.1 Pro,且成本仅为它们的1/10,其权重将于下周在Hugging Face开放。
入选理由:MiniMax M3在SWE Bench Pro上与GPT-5.5性能相当
张量是机器学习模型处理数据的基础结构,它将文本、图像、音频等现实世界输入转换为数字矩阵进行计算,最终输出有用结果。张量本质上是按形状组织的数字,包括标量(0D)、向量(1D)、矩阵(2D)和高维数组。
入选理由:张量是机器学习模型处理数据的核心结构,用于表示标量、向量、矩阵和高维数组。
Ideogram发布v4开源图像模型权重,支持本地部署与微调,成为当前最强开源文生图模型。
入选理由:Ideogram v4开放权重,允许用户在自有硬件上运行和微调模型。
张量是机器学习中组织数字的基本结构,用于将文本、图像和音频等现实世界数据转换为模型可处理的数值形式,实现从输入到输出的完整数据流。
入选理由:机器学习模型通过张量处理数据,张量是按形状组织的数字,标量为0D、向量为1D、矩阵为2D。
Transformers.js 通过 ONNX 标准在 JavaScript 中实现高效机器学习推理,自动处理模型下载、缓存和张量转换,简化 Web 端 AI 集成。
入选理由:Transformers.js 使用 ONNX Runtime 在 JavaScript 中运行模型推理,支持多种执行提供者。
Google 宣布其模型权重与主流开源生态兼容,可在 Hugging Face 和 Kaggle 直接下载,降低部署门槛。
入选理由:Gemma 4 权重与 llama.cpp、vLLM、Ollama 等生态兼容,便于本地部署与推理。
NVIDIA 宣布 Cosmos 3 模型完全开源,包括模型权重和后训练配方,现已在 Hugging Face 平台上线,支持开发者自由使用与研究。
入选理由:Cosmos 3 模型已完全开源,包含模型权重和后训练配方。
NVIDIA宣布Nemotron 3 Ultra模型完全开源,包含权重、合成数据及后训练配方,现已在Hugging Face上线。
入选理由:Nemotron 3 Ultra开源内容涵盖模型权重、合成数据集和完整的后训练配方(recipes)。
Ideogram发布v4开源图像模型权重,支持本地微调与私有化部署,但原文仅为简短公告缺乏技术细节。
入选理由:Ideogram v4已开放模型权重下载,允许用户在自有硬件上运行和微调。
Hugging Face CEO建议AI Agent默认将运行Trace私有存储于HF平台,以支持历史分析、共享及模型后训练优化。
入选理由:Clement Delangue演示了NanoClaw AI到Hugging Face的首个Trace集成案例。
NVIDIA的Physical AI Agent Skills工具允许通过简单提示生成视频变体,但文章仅演示操作步骤,缺乏技术深度和原理分析,信息密度低。
入选理由:使用breadth.nvidia.com/physicalai创建代理,可配置1,024 GB存储进行视频增强。
Cohere 赞助 hackathon,联合 Hugging Face 和 Gradio,推动小型化 AI 模型开发,降低成本并提升实用性。
入选理由:Cohere 赞助 hackathon,目标是开发小型化、低成本且实用的 AI 模型。
Cohere 发布推文,宣布 Hugging Face 和 Gradio 的注册将于明天截止,并推荐 Transcribe 和 Tiny Aya 模型用于黑客松比赛。
入选理由:Hugging Face 和 Gradio 的注册将于 6 月 3 日(周三)截止。
Nvidia 作为'美国开源 AI 之王',在 Hugging Face 上拥有 1,000+ 仓库(820 模型、249 数据集、57 空间),并发布 Cosmos 3 和 Alphamayo 2 Super 等新模型,采用 OpenMDW 框架推动开源 AI 发展。
入选理由:Nvidia 在 Hugging Face 上拥有 820 个模型、249 个数据集和 57 个空间,总仓库超 1,000 个。
Nvidia在Hugging Face上已拥有1000+公开仓库(820模型、249数据集、57空间)和近60,000关注者,其LocateAnything模型当前排名第一。
入选理由:Nvidia在Hugging Face上超过1000个公开仓库,包括820个模型、249个数据集和57个空间。
Hugging Face博客已成为AI社区学习和新闻的主要来源,NVIDIA、JetBrains等公司在此发布内容。
入选理由:Hugging Face博客(http://hf.co/blog)是AI社区学习和新闻的关键平台。
推文呼吁关注 Arcee 公司,但内容缺乏深度和实用性,仅为简单推荐。
入选理由:Arcee 是一家美国开源 AI 模型公司,但未提供具体模型或技术细节。
该推文仅为Google Gemma-4-12B-it模型在Hugging Face的发布链接,缺乏技术解析、性能数据或工程实践指导,信息密度极低,不具备独立阅读价值。
入选理由:Gemma-4-12B-it是Google发布的120亿参数指令微调模型,托管于Hugging Face平台。
该推文仅为Hugging Face数据集nanoclaw-traces的分享链接,缺乏技术解读与工程价值,不构成有效阅读材料。
入选理由:推文仅含Hugging Face数据集nanoclaw-traces链接,无技术说明或使用方法。
该推文仅为Nemotron 3 Ultra模型发布的简短公告,缺乏技术细节、架构说明或性能数据,不具备工程参考价值。
入选理由:Hugging Face于2026年6月4日发布Nemotron 3 Ultra模型公告推文。