26B MOE 最近有什么新动态？

traeai 已收录 2 篇与 26B MOE 相关的内容。最新一篇是「Gemma-4 12B + Hermes,Google AI Edge: EASY, GOOD & LOCAL!」，由 AICodeKing 发布。

模型

26B MOE

别名：26B Mixture of Experts

Gemma 系列中的一种混合专家模型，作为性能基准对比对象。

已跟踪 2 条高相关材料

Gemma-4 12B + Hermes,Google AI Edge: EASY, GOOD & LOCAL!

AICodeKing · 8.7 分

Gemma-4 12B 是无需编码器的统一多模态模型，直连 LLM，可在消费级 16GB 设备本地运行，性能接近 26B MOE 且内存占用不足其一半，配套 Hermes 等 Agent 工具与 macOS Edge Gallery，开源 Apache 2.0。

Introducing Gemma 4 12B: a unified, encoder-free multimodal model

The Keyword (blog.google) · 8.7 分

Gemma 4 12B 是面向本机运行的统一、无编码器多模态模型，将视觉与音频直接接入 LLM，性能接近 26B MoE 但内存仅为其一半，可在 16GB VRAM 紧凑设备上运行，支持离线语音处理与低延迟多步推理。

AICodeKing6月4日3109 字 (约 13 分钟)

Gemma-4 12B 采用统一无编码器架构，图像与音频直连 LLM，可在 16GB 设备本地运行；性能接近 26B MOE 且内存不足其半，配套 Hermes 等 Agent 工具与 macOS Edge Gallery，采用 Apache 2.0 开源许可。

入选理由：Gemma-4 12B 无需分别的视觉/音频编码器，图像与音频直接映射到 LLM，减少延迟与内存开销。

精选视频#Gemma#412B#多模态#本地部署#Hermes英文

The Keyword (blog.google)6月4日693 字 (约 3 分钟)

Gemma 4 12B 是面向本机运行的统一、无编码器多模态模型，将视觉与音频直接接入 LLM，性能接近 26B MoE 但内存仅其一半，可在 16GB VRAM 紧凑设备上运行，支持离线语音处理与低延迟多步推理。

入选理由：Gemma 4 12B 性能接近 26B MoE，内存仅其一半，适合在 16GB VRAM 现代本机运行。

精选文章#Gemma 4#12B#多模态#统一架构#无编码器英文

回答基于：26B MOE 相关 2 条材料