推出 Gemma 4 12B:面向本机的统一、无编码器多模态模型
Gemma 4 12B 是面向本机运行的统一、无编码器多模态模型,将视觉与音频直接接入 LLM,性能接近 26B MoE 但内存仅其一半,可在 16GB VRAM 紧凑设备上运行,支持离线语音处理与低延迟多步推理。
入选理由:Gemma 4 12B 性能接近 26B MoE,内存仅其一半,适合在 16GB VRAM 现代本机运行。
产品
别名:@ollama
本地运行AI模型的平台,提供Gemma 4 12B的运行环境。
已跟踪 30 条高相关材料
最近变化
2026-06-03 · ollama 宣布 Gemma 4 - 12B 模型已在其平台上可用。
为什么值得关注
Ollama 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。
Introducing Gemma 4 12B: a unified, encoder-free multimodal model
The Keyword (blog.google) · 8.7 分
Gemma 4 12B 是面向本机运行的统一、无编码器多模态模型,将视觉与音频直接接入 LLM,性能接近 26B MoE 但内存仅为其一半,可在 16GB VRAM 紧凑设备上运行,支持离线语音处理与低延迟多步推理。
How to Build Optimal AI Agents That Actually Work – A Handbook for Devs
freeCodeCamp.org · 8.7 分
AI代理系统的最优组织结构取决于任务复杂度与模型类型,Google研究通过150+实验发现:集中式或混合架构对OpenAI模型更有效,而Google模型在去中心化协作中表现更优。
Tweaking Local Language Model Settings with Ollama
KDnuggets · 8.5 分
Ollama 是运行本地语言模型的强大工具,通过 Modelfile 和环境变量可优化模型性能与硬件效率。
已收录 30 条与 Ollama 相关的内容,按评分排序。
Gemma 4 12B 是面向本机运行的统一、无编码器多模态模型,将视觉与音频直接接入 LLM,性能接近 26B MoE 但内存仅其一半,可在 16GB VRAM 紧凑设备上运行,支持离线语音处理与低延迟多步推理。
入选理由:Gemma 4 12B 性能接近 26B MoE,内存仅其一半,适合在 16GB VRAM 现代本机运行。
AI代理系统的最优组织结构取决于任务复杂度与模型类型,Google研究通过150+实验发现:集中式或混合架构对OpenAI模型更有效,而Google模型在去中心化协作中表现更优。
入选理由:超过150次实验证明,OpenAI模型在集中式管理架构下性能提升37%,优于去中心化模式。
Ollama 是运行本地语言模型的强大工具,通过 Modelfile 和环境变量可优化模型性能与硬件效率。
入选理由:通过 Ollama Modelfile 可封装模型参数,简化本地模型调用流程。
通过构建一个具有错误恢复机制的多工具 Gemma 4 代理,学习如何优雅地处理工具调用中的失败。
入选理由:迭代代理循环需设置最大迭代次数以防止无限循环。
Gemma 4 模型通过本地沙箱工具实现真正代理行为,支持文件系统探索和受限 Python 解释器。
入选理由:Gemma 4 支持本地工具调用,如文件系统探索和受限 Python 执行,增强模型自主性
文章介绍了本地语言模型的优势,如无需API密钥、无需数据转移等。
入选理由:Local models are easier to run and maintain compared to cloud tools.
作者通过两次构建B2B文档提取器,比较了基于规则的传统方法和基于LLM的方法,探讨了复杂性和布局多样性对两种方法的影响。
入选理由:基于LLM的方法在处理复杂和多变的布局时更具优势。
文章介绍如何用开源工具构建AI驱动的学习管理系统,包含个性化路径、动态测验等功能。
入选理由:使用Ollama+Mistral 7B实现本地语言模型,无需云服务
OpenJarvis 是由斯坦福 HazyResearch 和 Scaling Intelligence 实验室开发的本地优先个人AI,可与 Ollama 集成运行,旨在实现高效低功耗本地化AI体验,支持用户在无网络环境下使用。
入选理由:OpenJarvis 可通过 Ollama 在本地部署,无需云端连接,保障隐私与离线可用性。
MiniMax M3 模型已通过 Ollama Cloud 发布,支持 US 部署与零数据保留,专为编码和代理任务设计,在 SWE-Bench Pro 基准中达 59%+ 正确率,结合稀疏注意力实现 1M 上下文长度。
入选理由:M3 在 SWE-Bench Pro 基准中取得 59.0% 正确率,优于多数开源模型。
Ollama 新增 NVIDIA Blackwell GPU 以更好支持 GLM-5.1 模型。
入选理由:Ollama 已扩展 NVIDIA Blackwell GPU 阵容以优化 GLM-5.1 模型性能。
Peekaboo 3.0 发布,带来基于 macOS 的操作自动化新功能。
入选理由:Peekaboo 3.0 是自 2.0 以来最大更新
Ollama 发布 OpenJarvis,支持在本地运行大模型,无需联网,提升隐私与响应速度,适配开发者与企业用户。
入选理由:OpenJarvis 可通过 Ollama 在本地运行,无需联网即可访问 LLM 模型。
Poolside AI 发布首款开源权重模型 Laguna XS.2(33B总参/3B激活MoE),Apache 2.0 许可,支持单卡运行,专为智能体编程与长周期任务优化。
入选理由:Laguna XS.2 是 Poolside AI 首个开源权重模型,采用 MoE 架构
Google 宣布其模型权重与主流开源生态兼容,可在 Hugging Face 和 Kaggle 直接下载,降低部署门槛。
入选理由:Gemma 4 权重与 llama.cpp、vLLM、Ollama 等生态兼容,便于本地部署与推理。
PewDiePie推出的Odysseus AI工作区是一款可自托管的AI工具,支持Gemma-4 26B等模型,提供代理模式、深度研究和文档编辑功能,但缺乏技术深度分析和性能数据。
入选理由:Odysseus支持Gemma-4 26B模型,本地运行需至少16GB内存,可通过Ollama快速部署
Ollama 0.24 新增对 Codex 应用的支持,用户可通过命令行启动。
入选理由:更新至 Ollama 0.24 后可使用 codex-app 功能。
Ollama 推荐了多个与 Codex 配合使用的模型,包括支持视觉的 kimi-k2.6 和 glm-5.1。
入选理由:kimi-k2.6 支持视觉功能,适合图像相关任务。
Ollama 推出新一代旗舰模型 GLM-5.1,代码生成能力显著提升。
入选理由:GLM-5.1 是 Ollama 的新一代旗舰模型。
ollama 发布了 Hermes Agent,一个用于生成代码的 AI 工具。
入选理由:ollama 发布了 Hermes Agent,一个用于生成代码的 AI 工具。
ollama 宣布 Gemma 4 - 12B 模型已在其平台上可用。用户可以通过 MLX 运行该模型,支持 Hermes Agent 和 Claude Code 等工具。
入选理由:ollama 宣布 Gemma 4 - 12B 模型已在其平台上可用。
Ollama新增支持Claude Desktop的第三方推理接口,允许在Claude桌面应用中调用Ollama云端模型,但仅属功能集成公告,无技术深度或实践指导。
入选理由:Ollama现在可通过命令行启动claude-desktop集成Claude桌面端。
Ollama 在 X 平台发布 Minima 模型页面链接,但未提供模型架构、性能或部署方法,信息密度极低。
入选理由:Ollama 提供 Minima 模型页面(ollama.com/library/minima)供用户下载和运行轻量模型。
NVIDIA AI 在 X 平台发布了一条关于 @ollama 的推文,但内容缺乏具体技术细节。
入选理由:NVIDIA AI 在 X 平台上发布了与 @ollama 相关的内容。
Ollama 提供了恢复 Codex 默认设置的命令。
入选理由:使用 `ollama launch codex-app --restore` 可以恢复 Codex 的默认设置。
Ollama官方回应服务变慢问题,称未降低模型质量或缩减资源,而是因用户量激增,正在加紧部署新GPU以缓解性能压力。
入选理由:服务变慢并非由于降智或减量,模型能力保持不变。
Ollama 宣布为 DeepSeek v4 Pro 启用请求队列机制,以避免服务降级,但将导致更长的首 token 延迟。
入选理由:启用队列是应对高负载的临时策略,非性能优化
Ollama 推出命令行工具支持恢复使用 Anthropic 的 Claude 模型,但仅是功能提示,无技术深度或架构说明,信息密度极低。
入选理由:Ollama 支持通过 `ollama launch claude-desktop --restore` 恢复使用 Anthropic 的模型。
该内容仅为Ollama在X平台发布的文档链接推文,无实质性技术信息,仅引导用户访问外部文档页面,缺乏机制、原理或实践指导。
入选理由:该内容仅为Ollama在X平台发布的文档链接推文,无实质性技术信息,仅引导用户访问外部文档页面,缺乏机制、原理或实践指导
该推文仅包含一条短链接和平台导流文案,无实质性技术内容、模型参数、架构说明或使用指南。
入选理由:未提供任何可操作的技术信息