公司

Hugging Face

Q: 什么是 Hugging Face？

AI模型托管与开源社区平台。

Q: Hugging Face 最近有什么新动态？

traeai 已收录 30 篇与 Hugging Face 相关的内容。最新一篇是「Welcome NVIDIA Cosmos 3: The First Open Omni-model for Physical AI Reasoning and Action」，由 Hugging Face Blog 发布。

别名：huggingface

AI模型托管与开源社区平台。

已跟踪 30 条高相关材料

TraeAI 观察

如果只读 3 篇

Welcome NVIDIA Cosmos 3: The First Open Omni-model for Physical AI Reasoning and Action

Hugging Face Blog · 9.2 分

NVIDIA Cosmos 3 是首个开源的物理AI全能模型，整合世界生成、物理推理与动作生成于单一架构，支持机器人、自动驾驶等场景，基于MoT混合Transformer架构，提供Hugging Face模型卡与Diffusers集成。

Introducing Mellum2: A 12B Mixture-of-Experts Model by JetBrains

Hugging Face Blog · 9 分

JetBrains 发布 12B MoE 架构模型 Mellum2，每 token 仅激活 2.5B 参数，推理速度超同类模型 2 倍以上，专为代码与文本任务优化，支持私有部署和 RAG 等高频低延迟场景。

Gemma-4 12B + Hermes,Google AI Edge: EASY, GOOD & LOCAL!

AICodeKing · 8.7 分

Gemma-4 12B 是无需编码器的统一多模态模型，直连 LLM，可在消费级 16GB 设备本地运行，性能接近 26B MOE 且内存占用不足其一半，配套 Hermes 等 Agent 工具与 macOS Edge Gallery，开源 Apache 2.0。

欢迎 NVIDIA Cosmos 3：首个用于物理AI推理与行动的开源全能模型

Hugging Face Blog6月1日1912 字 (约 8 分钟)

NVIDIA Cosmos 3 是首个开源物理AI全能模型，整合世界生成、物理推理与动作生成于单模型，支持机器人、自动驾驶等场景，基于MoT架构并提供Hugging Face集成。

入选理由：Cosmos 3 是首个统一物理AI能力的开源模型，融合世界生成、物理推理与动作生成于单模型。

精选文章#NVIDIA#物理AI#Omni-model#Hugging Face#MoT架构英文

Introducing Mellum2: A 12B Mixture-of-Experts Model by JetBrains

Hugging Face Blog6月1日564 字 (约 3 分钟)

入选理由：Mellum2 是 12B 参数 MoE 模型，每 token 仅激活 2.5B 参数，推理效率提升 2x+，适合高吞吐生产环境。

精选文章#MoE#JetBrains#大模型#代码生成#RAG英文

Gemma-4 12B + Hermes,Google AI Edge: EASY, GOOD & LOCAL!

Gemma-4 12B + Hermes，Google AI Edge：本地、高效与易用

AICodeKing昨天3109 字 (约 13 分钟)

Gemma-4 12B 采用统一无编码器架构，图像与音频直连 LLM，可在 16GB 设备本地运行；性能接近 26B MOE 且内存不足其半，配套 Hermes 等 Agent 工具与 macOS Edge Gallery，采用 Apache 2.0 开源许可。

入选理由：Gemma-4 12B 无需分别的视觉/音频编码器，图像与音频直接映射到 LLM，减少延迟与内存开销。

精选视频#Gemma#412B#多模态#本地部署#Hermes英文

Introducing Gemma 4 12B: a unified, encoder-free multimodal model

推出 Gemma 4 12B：面向本机的统一、无编码器多模态模型

The Keyword (blog.google)昨天693 字 (约 3 分钟)

Gemma 4 12B 是面向本机运行的统一、无编码器多模态模型，将视觉与音频直接接入 LLM，性能接近 26B MoE 但内存仅其一半，可在 16GB VRAM 紧凑设备上运行，支持离线语音处理与低延迟多步推理。

入选理由：Gemma 4 12B 性能接近 26B MoE，内存仅其一半，适合在 16GB VRAM 现代本机运行。

精选文章#Gemma 4#12B#多模态#统一架构#无编码器英文

为 Reachy Mini 添加 MCP 工具

Hugging Face Blog6月3日2188 字 (约 9 分钟)

Hugging Face 推出 MCP 工具集成，使 Reachy Mini 机器人可通过 MCP 协议调用 Hugging Face Spaces 上的远程工具，如天气查询和网页搜索，无需修改本地应用代码，工具在云端运行，支持用户自定义发布工具，只需一条命令即可添加新能力，如询问巴黎今日天气。

入选理由：通过一条命令即可添加 MCP 工具：`reachy-mini-conversation-app tool-spaces add pollen-robotics/reachy-mini-weather-tool`，工具在云端运行，无需下载代码到本地机器。

精选文章#MCP#Hugging Face#机器人#工具集成英文

Holo3.1: Fast & Local Computer Use Agents

Holo3.1: 快速且本地化的计算机使用代理

Hugging Face Blog6月2日808 字 (约 4 分钟)

Holo3.1 是 Hugging Face 推出的全新计算机使用代理模型，支持跨桌面、移动端与多框架部署，并首次提供 FP8/Q4 GGUF/NVFP4 量化权重以实现本地高效推理。

入选理由：Holo3.1 在 AndroidWorld 上 35B-A3B 模型准确率从 67% 提升至 79.3%

精选文章#计算机使用代理#Hugging Face#量化模型#移动端自动化英文

Mellum2 Goes Open Source: A Fast Model for AI Workflows

Mellum2 开源：适用于AI工作流的快速模型

The JetBrains Blog6月2日606 字 (约 3 分钟)

Mellum2是JetBrains开源的12B参数AI模型，采用MoE架构使每token仅激活2.5B参数，推理速度比同类模型快50%，专为软件工程环境设计，适用于路由、RAG管道和私有AI部署等场景。

入选理由：Mellum2采用MoE架构，12B参数模型每token仅激活2.5B参数，推理速度比同类模型快50%，显著降低生产环境延迟和成本

精选文章#AI#模型#Mellum2#MoE#软件工程中文

Train AI Robots Without Writing Code! (Introducing LeLab)

无需编写代码训练 AI 机器人！（介绍 Lelab）

Hugging Face6月3日1234 字 (约 5 分钟)

Lelab 是一个图形化机器人控制平台，可实现零代码配置、数据采集与模型训练。

入选理由：通过简单界面完成机器人配置、校准及摄像头添加，零代码门槛。

精选视频#机器人#AI训练#无代码英文

Generating Synthetic Defect Images for Visual Inspection With Open Source Physical AI Agent Skills

使用开源物理AI代理技能生成合成缺陷图像用于视觉检测

NVIDIA Developer6月2日840 字 (约 4 分钟)

NVIDIA的合成数据生成代理可将视觉检测数据收集时间从数月压缩至几小时，通过自然语言提示自动生成PCB、玻璃和金属缺陷图像，显著提升模型训练效率。

入选理由：使用NVIDIA Physical AI Agent，输入自然语言提示如'PCB桥接缺陷'即可生成缺陷图像，单图生成耗时约10分钟。

精选视频#合成数据生成#视觉检测#NVIDIA#AI代理#工业AI英文

论文：GPU 预测器：语言模型作为内核运行时优化的选择性代理

AK(@_akhaliq)6月2日43 字 (约 1 分钟)

该论文提出了一种利用语言模型预测 GPU 内核运行时性能的新方法，实验表明其在多个基准测试中优于传统方法。

入选理由：论文提出 GPU Forecasters 方法，使用语言模型预测 GPU 内核性能。

精选推文#GPU#语言模型#性能优化#AI#计算加速英文

Open source is going to win

We already have an open-weights model competitive with GPT-5.5 and Opus...

开源将赢得胜利

Paul Couvert(@itsPaulAi)6月2日203 字 (约 1 分钟)

开源模型MiniMax M3已达到与GPT-5.5和Opus 4.7相当的性能，尤其在编码任务上优于Gemini 3.1 Pro，且成本仅为它们的1/10，其权重将于下周在Hugging Face开放。

入选理由：MiniMax M3在SWE Bench Pro上与GPT-5.5性能相当

精选推文#开源#AI模型#MiniMax M3#GPT-5.5#Gemini英文

什么是张量？

Hugging Face6月2日180 字 (约 1 分钟)

张量是机器学习模型处理数据的基础结构，它将文本、图像、音频等现实世界输入转换为数字矩阵进行计算，最终输出有用结果。张量本质上是按形状组织的数字，包括标量（0D）、向量（1D）、矩阵（2D）和高维数组。

入选理由：张量是机器学习模型处理数据的核心结构，用于表示标量、向量、矩阵和高维数组。

精选视频#张量#机器学习#深度学习#数据处理#Transformers.js英文

Ideogram just released their latest and best v4 image model open weights

State of the art and open ...

Ideogram发布最新最强v4图像模型开放权重

Hugging Face(@huggingface)今天132 字 (约 1 分钟)

Ideogram发布v4开源图像模型权重，支持本地部署与微调，成为当前最强开源文生图模型。

入选理由：Ideogram v4开放权重，允许用户在自有硬件上运行和微调模型。

精选推文#Ideogram#开源模型#文生图#Hugging Face英文

什么是张量？

Hugging Face6月2日180 字 (约 1 分钟)

张量是机器学习中组织数字的基本结构，用于将文本、图像和音频等现实世界数据转换为模型可处理的数值形式，实现从输入到输出的完整数据流。

入选理由：机器学习模型通过张量处理数据，张量是按形状组织的数字，标量为0D、向量为1D、矩阵为2D。

精选视频#张量#机器学习#Hugging Face#Transformers.js#数据处理英文

Transformers.js in 30 seconds #MachineLearning #AI #WebAI

30 秒了解 Transformers.js #机器学习 #AI #WebAI

Hugging Face6月2日158 字 (约 1 分钟)

Transformers.js 通过 ONNX 标准在 JavaScript 中实现高效机器学习推理，自动处理模型下载、缓存和张量转换，简化 Web 端 AI 集成。

入选理由：Transformers.js 使用 ONNX Runtime 在 JavaScript 中运行模型推理，支持多种执行提供者。

精选视频#Transformers.js#ONNX#JavaScript#机器学习#Web AI英文

> Ecosystem: Compatible with llama.cpp, MLX, @LMStudio, vLLM, @ollama, @UnslothAI, and SGLang.
&g...

Google AI Developers：Gemma 4 生态兼容与下载

Google AI Developers(@googleaidevs)昨天78 字 (约 1 分钟)

Google 宣布其模型权重与主流开源生态兼容，可在 Hugging Face 和 Kaggle 直接下载，降低部署门槛。

入选理由：Gemma 4 权重与 llama.cpp、vLLM、Ollama 等生态兼容，便于本地部署与推理。

精选推文#Gemma#开源生态#模型部署#Hugging Face#Kaggle英文

@ArtificialAnlys As always, Cosmos 3 is fully open. This includes model weights and post-training re...

NVIDIA 宣布 Cosmos 3 完全开源

NVIDIA AI(@NVIDIAAI)6月2日68 字 (约 1 分钟)

NVIDIA 宣布 Cosmos 3 模型完全开源，包括模型权重和后训练配方，现已在 Hugging Face 平台上线，支持开发者自由使用与研究。

入选理由：Cosmos 3 模型已完全开源，包含模型权重和后训练配方。

精选推文#NVIDIA#AI#开源#Hugging Face#模型英文

@openclaw @NousResearch @LangChain As always, Nemotron 3 Ultra is fully open.

This includes model w...

NVIDIA宣布Nemotron 3 Ultra完全开源

NVIDIA AI(@NVIDIAAI)今天88 字 (约 1 分钟)

NVIDIA宣布Nemotron 3 Ultra模型完全开源，包含权重、合成数据及后训练配方，现已在Hugging Face上线。

入选理由：Nemotron 3 Ultra开源内容涵盖模型权重、合成数据集和完整的后训练配方（recipes）。

精选推文#NVIDIA#Nemotron#开源模型#Hugging Face英文

Ideogram发布最新v4图像模型开源权重

Hugging Face(@huggingface)今天181 字 (约 1 分钟)

Ideogram发布v4开源图像模型权重，支持本地微调与私有化部署，但原文仅为简短公告缺乏技术细节。

入选理由：Ideogram v4已开放模型权重下载，允许用户在自有硬件上运行和微调。

精选推文#Ideogram#开源权重#图像生成#Hugging Face英文

Shared my first trace from @NanoClaw_AI to @huggingface yesterday. Very cool!

By default, all agen...

Hugging Face CEO：AI Agent应默认私有存储Trace以优化后训练

clem 🤗(@ClementDelangue)今天179 字 (约 1 分钟)

Hugging Face CEO建议AI Agent默认将运行Trace私有存储于HF平台，以支持历史分析、共享及模型后训练优化。

入选理由：Clement Delangue演示了NanoClaw AI到Hugging Face的首个Trace集成案例。

精选推文#Hugging Face#AI Agent#Tracing#Post-training英文

How to Augment Videos at Scale With Open-Source NVIDIA Physical AI Agent Skills

如何使用开源NVIDIA物理AI代理技能大规模增强视频

NVIDIA Developer6月2日738 字 (约 3 分钟)

NVIDIA的Physical AI Agent Skills工具允许通过简单提示生成视频变体，但文章仅演示操作步骤，缺乏技术深度和原理分析，信息密度低。

入选理由：使用breadth.nvidia.com/physicalai创建代理，可配置1,024 GB存储进行视频增强。

精选视频#英伟达#视频增强#AI代理#物理AI英文

We're sponsoring a hackathon to scale down.

Hosted by our friends @huggingface and @Gradio, we want...

Cohere 发起 hackathon 推动模型小型化

cohere(@cohere)6月2日142 字 (约 1 分钟)

Cohere 赞助 hackathon，联合 Hugging Face 和 Gradio，推动小型化 AI 模型开发，降低成本并提升实用性。

入选理由：Cohere 赞助 hackathon，目标是开发小型化、低成本且实用的 AI 模型。

精选推文#AI#黑客松#模型小型化#Cohere#Hugging Face英文

@huggingface @Gradio Registration closes tomorrow, Wednesday, June 3rd. Register here: https://t.co/...

Cohere 在 X 上发布：Hugging Face 和 Gradio 注册将于明天截止

cohere(@cohere)6月2日95 字 (约 1 分钟)

Cohere 发布推文，宣布 Hugging Face 和 Gradio 的注册将于明天截止，并推荐 Transcribe 和 Tiny Aya 模型用于黑客松比赛。

入选理由：Hugging Face 和 Gradio 的注册将于 6 月 3 日（周三）截止。

精选推文#Hugging Face#Gradio#Cohere#黑客松#模型英文

So much great work lately from Nvidia, the "King of American Open-source AI"!

- Crossed 1,000 total...

Nvidia 作为'美国开源 AI 之王'的近期进展

clem 🤗(@ClementDelangue)6月2日237 字 (约 1 分钟)

Nvidia 作为'美国开源 AI 之王'，在 Hugging Face 上拥有 1,000+ 仓库（820 模型、249 数据集、57 空间），并发布 Cosmos 3 和 Alphamayo 2 Super 等新模型，采用 OpenMDW 框架推动开源 AI 发展。

入选理由：Nvidia 在 Hugging Face 上拥有 820 个模型、249 个数据集和 57 个空间，总仓库超 1,000 个。

精选推文#Nvidia#Hugging Face#OpenMDW#Cosmos 3#Alphamayo 2 Super英文

Nvidia在Hugging Face上的成就

Hugging Face(@huggingface)6月2日89 字 (约 1 分钟)

Nvidia在Hugging Face上已拥有1000+公开仓库（820模型、249数据集、57空间）和近60,000关注者，其LocateAnything模型当前排名第一。

入选理由：Nvidia在Hugging Face上超过1000个公开仓库，包括820个模型、249个数据集和57个空间。

精选推文#Hugging Face#Nvidia#AI#模型#数据集英文

It's cool to see that the https://t.co/SdGWBBVrqG has become progressively a major source of learnin...

Hugging Face博客作为AI学习和新闻来源

clem 🤗(@ClementDelangue)6月2日156 字 (约 1 分钟)

Hugging Face博客已成为AI社区学习和新闻的主要来源，NVIDIA、JetBrains等公司在此发布内容。

入选理由：Hugging Face博客（http://hf.co/blog）是AI社区学习和新闻的关键平台。

精选推文#Hugging Face#AI#博客#社区英文

Arcee needs more attention that it gets! There aren't a lot of great American open-source AI model c...

Arcee 需要更多关注！

clem 🤗(@ClementDelangue)6月2日82 字 (约 1 分钟)

推文呼吁关注 Arcee 公司，但内容缺乏深度和实用性，仅为简单推荐。

入选理由：Arcee 是一家美国开源 AI 模型公司，但未提供具体模型或技术细节。

精选推文#AI#开源#美国公司#Arcee英文

Philipp Schmid 发布 Gemma-4-12B-it 模型链接

Philipp Schmid(@_philschmid)今天53 字 (约 1 分钟)

该推文仅为Google Gemma-4-12B-it模型在Hugging Face的发布链接，缺乏技术解析、性能数据或工程实践指导，信息密度极低，不具备独立阅读价值。

入选理由：Gemma-4-12B-it是Google发布的120亿参数指令微调模型，托管于Hugging Face平台。

精选推文#Gemma-4#Hugging Face#LLM英文

clem 🤗 在 X 上分享 nanoclaw-traces 数据集链接

clem 🤗(@ClementDelangue)今天54 字 (约 1 分钟)

该推文仅为Hugging Face数据集nanoclaw-traces的分享链接，缺乏技术解读与工程价值，不构成有效阅读材料。

入选理由：推文仅含Hugging Face数据集nanoclaw-traces链接，无技术说明或使用方法。

精选推文#HuggingFace#数据集英文

Nemotron 3 Ultra!

Hugging Face(@huggingface)今天31 字 (约 1 分钟)

该推文仅为Nemotron 3 Ultra模型发布的简短公告，缺乏技术细节、架构说明或性能数据，不具备工程参考价值。

入选理由：Hugging Face于2026年6月4日发布Nemotron 3 Ultra模型公告推文。

精选推文#Nemotron#Hugging Face#大模型发布英文

跨材料问答 · Hugging Face

回答基于：Hugging Face 相关 30 条材料