T
traeai
登录

模型

Gemma 4

别名:Gemma4、Gemma 4 12B

Google发布的120亿参数原生多模态大语言模型,支持文本、图像、音频统一处理。

已跟踪 21 条高相关材料

TraeAI 观察

相关材料

已收录 21 条与 Gemma 4 相关的内容,按评分排序。

Google AI Studio 3.0 (Fully Free): This is ACTUALLY AWESOME!

Google AI Studio 3.0 (Fully Free): This is ACTUALLY AWESOME!

AICodeKing979 字 (约 4 分钟)
87

Google AI Studio 3.0 全免费上线,集成 Gemma 4 模型与多模态能力,支持实时推理、自定义模型部署和 API 接入,显著降低开发者使用门槛。

入选理由:Gemma 4 模型在 Google AI Studio 3.0 中完全免费,支持 128K 上下文长度。

精选视频#Google AI Studio#Gemma 4#AI 开发工具#免费 AI 平台中文
Building a Multi-Tool Gemma 4 Agent with Error Recovery

Building a Multi-Tool Gemma 4 Agent with Error Recovery

Machine Learning Mastery3497 字 (约 14 分钟)
85

通过构建一个具有错误恢复机制的多工具 Gemma 4 代理,学习如何优雅地处理工具调用中的失败。

入选理由:迭代代理循环需设置最大迭代次数以防止无限循环。

精选文章#Gemma 4#工具调用#错误恢复#迭代代理英文
Hugging Face Blog 图标

Reachy Mini goes fully local

Hugging Face Blog1966 字 (约 8 分钟)
85

Reachy Mini 现在可以在本地运行语音后端,无需连接到云端服务器。

入选理由:部署本地语音后端于 Reachy Mini 上。

精选文章#Reachy Mini#语音后端#本地服务中文
Easy Agentic Tool Calling with Gemma 4

使用 Gemma 4 实现简易代理工具调用

KDnuggets2859 字 (约 12 分钟)
85

Gemma 4 模型通过本地沙箱工具实现真正代理行为,支持文件系统探索和受限 Python 解释器。

入选理由:Gemma 4 支持本地工具调用,如文件系统探索和受限 Python 执行,增强模型自主性

精选文章#Gemma 4#Agent#Tool Calling#Security#Python英文
TLMs: Tiny LLMs and Agents on Edge Devices with @cormacb 

https://t.co/u0fHD7j5kZ

Function Gemma s...

本文介绍了Tiny LLMs和Agents在边缘设备上的应用,特别是Function Gemma模型在Pixel 7上的性能表现,以及开发者在设备上实现AI的两种路径:基于Gemma 4的技能框架和Eloquent生产转录应用。

入选理由:Function Gemma模型在Pixel 7上以270M参数运行,预填处理速度达到近2000 token/秒,出厂时在固定应用意图上准确率达到46%。

精选推文#Tiny LLMs#Edge Devices#Function Gemma#AI on Devices#Machine Learning中文
Recent Developments in LLM Architectures: KV Sharing, mHC, and Compressed Attention

LLM架构近期发展:KV共享、mHC和压缩注意力

Ahead of AI5634 字 (约 23 分钟)
85

LLM架构近期发展聚焦于KV共享、mHC和压缩注意力,以提升长上下文效率。

入选理由:Gemma 4引入KV共享和每层嵌入,优化内存使用。

精选文章#LLM#架构优化#注意力机制英文
A Smarter Google AI Edge Gallery: MCP integration, notifications, and session continuity

更智能的 Google AI Edge Gallery:MCP 集成、通知和会话连续性

Google Developers Blog1169 字 (约 5 分钟)
80

Google AI Edge Gallery 新增三大核心能力:支持 MCP 协议实现跨数据源工具调用、本地通知调度实现主动交互、以及聊天历史持久化,使移动端 Agent 开发从响应式转向自动化与连续性。

入选理由:通过注册MCP URL,应用可将工具定义动态导入本地模型系统提示词,推理完全在手机端完成,请求由MCP服务器执行

精选文章#Google AI Edge Gallery#MCP#端侧 AI#Gemma 4#移动 Agent英文
Ok that's so cool

Multi-token prediction makes Gemma 4 run way faster locally!

Same model, same la...

Ok that's so cool

Paul Couvert(@itsPaulAi)281 字 (约 2 分钟)
78

多令牌预测技术使Gemma 4模型在本地运行速度提升1.5倍,达到138 tokens/s。

入选理由:Gemma 4使用MTP后,性能从97 tokens/s提升至138 tokens/s。

精选推文#Gemma 4#MTP#开源中文
We released Gemma 4 12B yesterday. Here is a visual guide that explains the full architecture.

→ Ho...

Gemma 4 12B发布:原生多模态架构视觉指南

Philipp Schmid(@_philschmid)169 字 (约 1 分钟)
75

Gemma 4 12B通过移除独立视觉与音频编码器,采用原生多模态架构实现单模型处理文本、图像和音频。该设计摒弃传统外挂编码器拼接模式,直接在统一表征空间内完成跨模态对齐,显著降低推理延迟并提升端侧部署效率。

入选理由:Gemma 4 12B移除独立视觉/音频编码器,采用原生多模态统一架构

精选推文#Gemma 4#多模态大模型#原生多模态架构#端侧AI英文
Gemma 4 Multi-Token Prediction Delivers Up to ~3x Faster Token Generation

Gemma 4 引入多令牌预测技术,使令牌生成速度提升高达 3 倍,显著改善大模型推理效率。

入选理由:Gemma 4 采用多令牌预测技术,将令牌生成速度提升至原来的 3 倍。

精选文章#AI#LLM#Gemma#Transformer#Token Generation英文
AI on Android: Ask me Anything — Florina Muntenescu & Oli Gaymond, Google DeepMind

Android开发者可以通过三种方式构建智能体验:纯设备端模型、混合模式(设备端优先云端备选)、纯云端推理,其中Gemini Nano作为最高效的设备端模型通过AI Core系统服务统一管理,支持ML Kit GenAI API和Light Art LM两种实现方式。

入选理由:Android支持三种AI部署模式:纯设备端、混合模式、纯云端推理

精选视频#Android#AI#Gemini Nano#ML Kit#设备端AI英文
Google Developers Blog 图标

Google I/O 2026 开发者主题演讲全部新闻

Google Developers Blog818 字 (约 4 分钟)
75

Google 在 I/O 2026 开发者主题演讲中宣布从 AI 助手向自主代理转型,重点发布 Gemini 3.5 系列模型、升级 Antigravity 2.0 agent-first 开发平台,并推出 Android CLI、Android Bench、WebMCP 等新工具,帮助开发者构建高质量应用。

入选理由:Google 推出 Gemini 3.5 系列模型并升级 Antigravity 2.0 平台,支持跨平台终端沙箱、凭证掩码和强化 Git 策略的子代理编排

精选文章#Google I/O#AI 代理#Android#Gemini#Web 开发英文
Blazing fast on-device GenAI with LiteRT-LM

LiteRT-LM:设备端 GenAI 的极速体验

Google Developers Blog1574 字 (约 7 分钟)
75

Google AI Edge 发布 LiteRT-LM 推理引擎,专为在边缘设备上高效运行 Gemma 4 模型设计,支持 Android、iOS、Web 多平台,GPU 推理可达 76 tokens/sec,结合 Multi-Token Prediction 技术实现 2.2 倍加速。

入选理由:LiteRT-LM 在 Android GPU (OpenCL) 上实现 52 tokens/sec 解码速度,iOS (Metal) 达 56 tokens/sec,WebGPU 在 MacBook Pro 上可达 76 tokens/sec

精选文章#Google AI Edge#LiteRT-LM#Gemma 4#边缘AI#端侧推理英文
MTP drafters for Gemma 4 are available today under the same open-source Apache 2.0 license. Read the...

Google发布了Gemma 4的MTP drafters,采用Apache 2.0开源许可,可从Kaggle和Hugging Face下载。

入选理由:Gemma 4的MTP drafters现已发布,使用Apache 2.0开源许可。

精选推文#Gemma 4#MTP drafters#开源英文
.@GoogleDeepMind's Gemma 4 - 12B is available on Ollama!  

Chat: 
ollama run gemma4:12b-mlx

Hermes...

@GoogleDeepMind's Gemma 4 - 12B is available on Ollama!

ollama(@ollama)104 字 (约 1 分钟)
60

ollama 宣布 Gemma 4 - 12B 模型已在其平台上可用。用户可以通过 MLX 运行该模型,支持 Hermes Agent 和 Claude Code 等工具。

入选理由:ollama 宣布 Gemma 4 - 12B 模型已在其平台上可用。

精选推文#ollama#Gemma 4#MLX中文
End-of-week call for community builds!

Have a project or demo that showcases Gemma 4 Multi-Token Pr...

End-of-week call for community builds!

Google AI Developers(@googleaidevs)163 字 (约 1 分钟)
45

Google AI邀请开发者展示Gemma 4 MTP等项目。

入选理由:Google AI邀请开发者分享Gemma 4 MTP项目

精选推文#Google AI#开发者社区中文
Accelerating Gemma 4: faster inference with  multi-token prediction drafters

加速Gemma 4:通过多标记预测草稿器实现更快推理

The Keyword (blog.google)1732 字 (约 7 分钟)
45

文章仅提及Gemma 4使用多标记预测加速推理,未提供技术细节、实验数据或实现方法,属于宣传性轻量公告,缺乏工程参考价值。

入选理由:Gemma 4通过多标记预测(MTP)加速推理,速度提升最高达3倍。

精选文章#Gemma#多标记预测#推理优化#Google DeepMind英文

跨材料问答 · Gemma 4

回答基于:Gemma 4 相关 21 条材料
    0 / 500

    AI 可能会生成不准确的信息,请核实重要内容