ollama(@ollama)
Gemma 4 Quantization-Aware Training (QAT) weights are now available on Ollama! They reduce memory ...
8.5Score

TL;DR · AI 摘要
Gemma 4 QAT模型在Ollama和Hugging Face上线,显著降低内存需求并保持模型质量。
核心要点
- Gemma 4 QAT模型在Ollama和Hugging Face上线,支持多种模型大小。
- QAT技术可降低内存需求,同时保持模型质量。
- 用户可通过ollama run命令运行不同版本的Gemma 4 QAT模型。
结构提纲
按章节快速跳转。
Gemma 4 QAT模型在Ollama和Hugging Face上线,支持多种模型大小。
QAT技术可降低内存需求,同时保持模型质量。
用户可通过ollama run命令运行不同版本的Gemma 4 QAT模型。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- Gemma 4 QAT模型发布
- QAT技术优势
- 降低内存需求
- 保持模型质量
- 模型运行方式
- ollama run命令
金句 / Highlights
值得收藏与分享的关键句。
Gemma 4 QAT weights are now available on Ollama! They reduce memory requirements while maintaining model quality.
All Gemma 4 model sizes and their drafters are now optimized with QAT to cut memory requirements and maximize on-device performance!
E2B: ollama run gemma4:e2b-it-qat E4B: ollama run gemma4:e4b-it-qat 12B: ollama run gemma4:12b-it-qat 26B: ollama run gemma4:26b-a4b-it-qat 31B: ollama run gemma4:31b-it-qat
#Gemma#QAT#Ollama#Hugging Face#模型优化
打开原文ollama on X: "Gemma 4 量化感知训练(QAT)权重现已在 Ollama 上提供!它们在保持模型质量的同时减少了内存需求。E2B: ollama run gemma4:e2b-it-qat E4B: ollama run gemma4:e4b-it-qat 12B: ollama run gemma4:12b-it-qat 26B: ollama run" / X
ollama
@ollama
Gemma 4 量化感知训练(QAT)权重现已在 Ollama 上提供!它们在保持模型质量的同时减少了内存需求。E2B: ollama run gemma4:e2b-it-qat E4B: ollama run gemma4:e4b-it-qat 12B: ollama run gemma4:12b-it-qat 26B: ollama run gemma4:26b-a4b-it-qat 31B: ollama run gemma4:31b-it-qat 使用 ollama launch integrations 将它们与您喜爱的工具一起使用 👇👇👇
Google Gemma
@googlegemma
6月5日
我们刚刚在 Hugging Face 上发布了 Gemma 4 量化感知训练(QAT)检查点!所有 Gemma 4 模型大小及其草稿模型现在都通过 QAT 进行了优化,以减少内存需求并最大化设备上的性能!
2026年6月5日 下午6:32
107.3K
浏览量
4
1
41
5
9
159
.
K
1.5K
7
3
2
732
阅读41条回复