Gemma 4 Quantization-Aware Training (QAT) weights are now available on Ollama! 

They reduce memory ...

ollama(@ollama)

ollama(@ollama)2026年6月5日

Gemma 4 Quantization-Aware Training (QAT) weights are now available on Ollama! They reduce memory ...

8.5Score

TL;DR · AI 摘要

Gemma 4 QAT模型在Ollama和Hugging Face上线，显著降低内存需求并保持模型质量。

核心要点

Gemma 4 QAT模型在Ollama和Hugging Face上线，支持多种模型大小。
QAT技术可降低内存需求，同时保持模型质量。
用户可通过ollama run命令运行不同版本的Gemma 4 QAT模型。

结构提纲

按章节快速跳转。

§Gemma 4 QAT模型发布
Gemma 4 QAT模型在Ollama和Hugging Face上线，支持多种模型大小。
·QAT技术优势
QAT技术可降低内存需求，同时保持模型质量。
›模型运行方式
用户可通过ollama run命令运行不同版本的Gemma 4 QAT模型。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

Gemma 4 QAT模型发布
- QAT技术优势
  - 降低内存需求
  - 保持模型质量
- 模型运行方式
  - ollama run命令

金句 / Highlights

值得收藏与分享的关键句。

Gemma 4 QAT weights are now available on Ollama! They reduce memory requirements while maintaining model quality.
— 第 1 段
⬇︎ 下载 PNG 𝕏 分享到 X
All Gemma 4 model sizes and their drafters are now optimized with QAT to cut memory requirements and maximize on-device performance!
— 第 2 段
⬇︎ 下载 PNG 𝕏 分享到 X
E2B: ollama run gemma4:e2b-it-qat E4B: ollama run gemma4:e4b-it-qat 12B: ollama run gemma4:12b-it-qat 26B: ollama run gemma4:26b-a4b-it-qat 31B: ollama run gemma4:31b-it-qat
— 第 1 段
⬇︎ 下载 PNG 𝕏 分享到 X

#Gemma#QAT#Ollama#Hugging Face#模型优化

打开原文

ollama on X: "Gemma 4 量化感知训练（QAT）权重现已在 Ollama 上提供！它们在保持模型质量的同时减少了内存需求。E2B: ollama run gemma4:e2b-it-qat E4B: ollama run gemma4:e4b-it-qat 12B: ollama run gemma4:12b-it-qat 26B: ollama run" / X

ollama

@ollama

Gemma 4 量化感知训练（QAT）权重现已在 Ollama 上提供！它们在保持模型质量的同时减少了内存需求。E2B: ollama run gemma4:e2b-it-qat E4B: ollama run gemma4:e4b-it-qat 12B: ollama run gemma4:12b-it-qat 26B: ollama run gemma4:26b-a4b-it-qat 31B: ollama run gemma4:31b-it-qat 使用 ollama launch integrations 将它们与您喜爱的工具一起使用 👇👇👇

Google Gemma

@googlegemma

6月5日

我们刚刚在 Hugging Face 上发布了 Gemma 4 量化感知训练（QAT）检查点！所有 Gemma 4 模型大小及其草稿模型现在都通过 QAT 进行了优化，以减少内存需求并最大化设备上的性能！

2026年6月5日下午6:32

107.3K

浏览量

4

1

41

5

9

159

.

K

1.5K

7

3

2

732

阅读41条回复