Gemma 4 12B登陆笔记本：用Google AI Edge解锁本地Agent工作流

Google Developers Blog

Google Developers Blog2026年6月5日

Gemma 4 12B登陆笔记本：用Google AI Edge解锁本地Agent工作流

8.2Score

TL;DR · AI 摘要

Gemma 4 12B模型结合Google AI Edge栈已实现笔记本端本地运行，支持macOS上的代码生成、语音编辑及OpenAI兼容API服务。该组合使设备端Agent工作流成为可能，指令遵循质量提升超60%，且全程离线保障数据隐私。

核心要点

Gemma 4 12B通过LiteRT-LM在消费级笔记本运行，支持本地Agent与多模态任务。
AI Edge Eloquent新增Voice Edit功能，指令遵循质量较前代提升60%以上。
LiteRT-LM CLI提供serve命令，一键启动兼容OpenAI格式的本地推理端点。

结构提纲

按章节快速跳转。

§Gemma 4 12B本地化能力概览
Gemma 4 12B模型专为笔记本端设计，结合Google AI Edge栈可实现完全离线的Agent和多模态智能工作流。
·AI Edge Gallery代码生成实测
macOS版AI Edge Gallery支持自然语言驱动Python脚本生成与执行，可在单轮对话中完成3D渲染等复杂编码任务。
·Eloquent语音编辑与转录
AI Edge Eloquent利用Gemma 4 12B实现全离线语音听写与文本重构，指令遵循质量相比前代模型提升超过60%。
·LiteRT-LM本地服务端点
LiteRT-LM CLI新增serve命令，允许开发者直接在终端启动兼容行业标准的本地模型推理接口以构建Agent工具。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

Gemma 4 12B Local AI
- Core Tools
  - AI Edge Gallery (Coding)
  - Eloquent (Voice Edit)
  - LiteRT-LM (Serving)
- Key Capabilities
  - On-device Agentic Workflow
  - Offline Multimodal Reasoning
  - OpenAI-compatible API

金句 / Highlights

值得收藏与分享的关键句。

Gemma 4 12B在指令遵循、范围控制和整体质量上较前代有巨大飞跃，提升幅度超过60%。
— Dictation and Voice-Driven Editing Section
⬇︎ 下载 PNG 𝕏 分享到 X
LiteRT-LM现可通过新的serve命令直接在终端提供兼容行业标准的本地端点，为全本地Agent工具赋能。
— Introduction Section
⬇︎ 下载 PNG 𝕏 分享到 X
在复杂3D渲染任务中，模型能在单轮对话内自动生成依赖规范、编写代码并完成自我修正。
— Coding with Google AI Edge Gallery Section
⬇︎ 下载 PNG 𝕏 分享到 X

#Gemma 4#Google AI Edge#端侧AI#LiteRT-LM#Agent工作流

打开原文

标题：将 Gemma 4 12B 引入您的笔记本电脑：借助 Google AI Edge 解锁本地智能体工作流

URL 来源：https://developers.googleblog.com/bringing-gemma-4-12b-to-your-laptop-unlocking-local-agentic-workflows-with-google-ai-edge/

发布时间：2026-06-03

Markdown 内容： 2026 年 6 月 3 日

Google DeepMind 最新的开源模型 Gemma 4 12B 旨在将智能体化、多模态的智能直接带到您的笔记本电脑上。通过将该模型的优势与 Google AI Edge 技术栈相结合，您可以在日常设备上立即动手进行本地构建和实验（请参阅模型卡了解规格要求）。

这种模型与运行时的组合释放了强大的端侧能力，涵盖自主数据处理、生成丰富的视觉洞察，乃至构建功能完备的网页和执行日常工具调用。您现在就可以通过 Google AI Edge 开始与 Gemma 4 12B 互动：

使用 Google AI Edge Gallery 探索 Gemma，这是我们的本地 AI 展示应用，**现已登陆 macOS**。借助 12B 模型，您可以即时生成并执行脚本以完成数据分析等任务。
Google AI Edge Eloquent 端侧语音听写应用**现已登陆 macOS**。我们新增了通过语音命令*交互式*润色和重写文本的功能，该功能完全在设备端运行，由全新的 Gemma 4 12B 模型提供支持。
LiteRT-LM 现在可以通过 LiteRT-LM CLI 中新增的 _serve_ 命令，直接从终端提供兼容行业标准的本地端点。与 Gemma 4 12B 配合使用时，这是一个高效且功能强大的选项，可为完全本地的智能体工具、编排框架和工作流提供动力支持。

在 MacOS 上使用 Google AI Edge Gallery 进行编程

Google AI Edge Gallery 应用现已登陆 macOS，展示了 Gemma 4 12B 的编程能力，让您能够直接在设备上从数据中提取有价值的洞察。通过无缝集成的界面，您只需用自然语言描述分析目标即可。在下面的示例中，我们提供了两个包含数据的文本文件，并要求模型“使用 Python 程序渲染一张图表 PNG，对比 2024 年与 2025 年出生率最高的前 10 个女孩名字”。作为响应，模型动态生成了 Python 代码并在本地执行，将原始数据转化为美观且易于理解的可视化图表和洞察。

视频 7

在高级编程方面，Gemma 4 12B 不仅仅能编写脚本。在一个复杂的 3D 渲染任务中，我们观察到仅需一条用户提示，模型就能在一个回合内生成带有依赖规范的橡皮鸭渲染代码，并完成代码生成与自我修正。

提示词："use trimesh to write a python program to render the attached obj file to a png file"

立即下载 macOS 版 Google AI Edge Gallery，体验使用 Gemma 4 12B 进行本地编程。

使用 Google AI Edge Eloquent 进行听写和语音驱动编辑

视频 8

Google AI Edge Eloquent 是我们推出的 AI 驱动听写与编辑应用，可将您原始、非结构化的想法无缝转化为精炼的文本。全新的 MacOS 桌面版在所有功能上均实现 100% 设备端运行，确保提供强大且完全离线的体验。通过便捷、可自定义的快捷键，Eloquent 让您能够在 Mac 上的任何应用程序中使用语音听写。此外，Eloquent 还支持对音频或视频文件进行完全本地的转录。

借助 Gemma 4 12B 先进的推理能力，我们推出了语音编辑 (Voice Edit) 这一新功能，让您只需通过语音指令即可转换桌面工作流中的任何文本。例如，您可以选中一段文字然后说：“将这些笔记重构为管理层摘要”，或者“将其翻译成印地语”。与前代模型相比，Gemma 4 12B 实现了巨大飞跃，其指令遵循能力更强，范围把控更严格，整体质量提升了 60% 以上。

立即下载 macOS 版 Google AI Edge Eloquent，体验 Gemma 4 12B 作为全本地 AI 听写与编辑助手的强大功能。

使用 LiteRT-LM 进行构建，包括即插即用的本地服务

**LiteRT-LM CLI** 提供了一个轻量级、零代码的工具，用于在本地运行语言模型。我们现在通过 **serve** 命令对该工具进行了扩展，使 CLI 能够充当即插即用的本地 LLM 服务器。将此功能与 Gemma 4 12B 结合使用，您可以将任何标准工具、SDK 或框架（如 OpenClaw、Hermes、OpenCode、Pi，或 Continue 和 Aider 等流行扩展）直接指向您的本地端点。

code

# Import the Gemma 4 12B model as "gemma4-12b"
litert-lm import --from-huggingface-repo=litert-community/gemma-4-12B-it-litert-lm gemma-4-12B-it.litertlm gemma4-12b

# Start the OpenAI-compatible server
litert-lm serve

Shell

Copied

code

curl http://localhost:9379/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemma4-12b,gpu",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Shell

Copied

视频 9 演示 LiteRT-LM CLI serve 命令：创建行业兼容的本地端点，将 Gemma 4 12B 与 Open WebUI 连接，实现一次性粒子特效演示。

可在日常笔记本电脑上轻松使用

运行 Gemma 4 12B 让设备端 AI 驱动的功能在日常笔记本电脑上得以广泛普及。请查看 LiteRT-LM 模型卡以了解性能和内存基准测试结果。通过将这一新模型的强大能力与 Google AI Edge 优化的性能及易用性相结合，您可以构建多轮对话本地智能体、在 Google AI Edge Gallery 中分析数据，或使用 Google AI Edge Eloquent 优化写作体验。此外，您的数据始终保留在设备本地，同时还能确保可靠的响应速度、实用性和成本效益。

致谢

我们要特别感谢以下对本项目做出重要贡献的贡献者（按字母顺序排列）：

Advait Jain, Alice Zheng, Alex Kanaukou, Ami Kubota, Changming Sun, Cormac Brick, Denis Daletski, Fengwu Yao, Hriday Chhabria, Jingxiao Zheng, Jingtao Zhou, Jenn Lee, Jianing Wei, Jing Jin, Lin Chen, Lu Wang, Marius Kintel, Marissa Ikonomidis, Matthias Grundmann, Mogan Shieh, Mohammadreza Heydary, Matthew Soulanille, Na Li, Qidong Zhao, Queenie Zhang, Ram Iyengar, Rishika Sinha, Sachin Kotwani, Suleman Shahid, Suril Shah, Tenghui Zhu, Wai Hon Law, Weiyi Wang, Xiaoming Hu, Xinan Cheng, Yi-Chun Kuo, Yishuang Pang, Yu-hui Chen.

[](https://developers.googleblog.com/gemma-4-12b-the-developer-guide/) 上一篇

Gemma 4 12B登陆笔记本：用Google AI Edge解锁本地Agent工作流

TL;DR · AI 摘要

核心要点

结构提纲

思维导图

金句 / Highlights

**在 MacOS 上使用 Google AI Edge Gallery 进行编程**

**使用 Google AI Edge Eloquent 进行听写和语音驱动编辑**

**使用 LiteRT-LM 进行构建，包括即插即用的本地服务**

**可在日常笔记本电脑上轻松使用**

**致谢**

在 MacOS 上使用 Google AI Edge Gallery 进行编程

使用 Google AI Edge Eloquent 进行听写和语音驱动编辑

使用 LiteRT-LM 进行构建，包括即插即用的本地服务

可在日常笔记本电脑上轻松使用

致谢