产品

Ollama

Q: Ollama 最近有什么新动态？

traeai 已收录 30 篇与 Ollama 相关的内容。最新一篇是「Introducing Gemma 4 12B: a unified, encoder-free multimodal model」，由 The Keyword (blog.google) 发布。

别名：@ollama

本地运行AI模型的平台，提供Gemma 4 12B的运行环境。

已跟踪 30 条高相关材料

TraeAI 观察

如果只读 3 篇

Introducing Gemma 4 12B: a unified, encoder-free multimodal model

The Keyword (blog.google) · 8.7 分

Gemma 4 12B 是面向本机运行的统一、无编码器多模态模型，将视觉与音频直接接入 LLM，性能接近 26B MoE 但内存仅为其一半，可在 16GB VRAM 紧凑设备上运行，支持离线语音处理与低延迟多步推理。

How to Build Optimal AI Agents That Actually Work – A Handbook for Devs

freeCodeCamp.org · 8.7 分

AI代理系统的最优组织结构取决于任务复杂度与模型类型，Google研究通过150+实验发现：集中式或混合架构对OpenAI模型更有效，而Google模型在去中心化协作中表现更优。

Tweaking Local Language Model Settings with Ollama

KDnuggets · 8.5 分

Ollama 是运行本地语言模型的强大工具，通过 Modelfile 和环境变量可优化模型性能与硬件效率。

推出 Gemma 4 12B：面向本机的统一、无编码器多模态模型

The Keyword (blog.google)6月4日693 字 (约 3 分钟)

Gemma 4 12B 是面向本机运行的统一、无编码器多模态模型，将视觉与音频直接接入 LLM，性能接近 26B MoE 但内存仅其一半，可在 16GB VRAM 紧凑设备上运行，支持离线语音处理与低延迟多步推理。

入选理由：Gemma 4 12B 性能接近 26B MoE，内存仅其一半，适合在 16GB VRAM 现代本机运行。

精选文章#Gemma 4#12B#多模态#统一架构#无编码器英文

How to Build Optimal AI Agents That Actually Work – A Handbook for Devs

如何构建真正有效的最优AI代理——开发者手册

freeCodeCamp.org5月11日5915 字 (约 24 分钟)

入选理由：超过150次实验证明，OpenAI模型在集中式管理架构下性能提升37%，优于去中心化模式。

精选文章#AI代理#大语言模型#Google研究#多代理系统#Ollama英文

Tweaking Local Language Model Settings with Ollama

KDnuggets5月28日2864 字 (约 12 分钟)

Ollama 是运行本地语言模型的强大工具，通过 Modelfile 和环境变量可优化模型性能与硬件效率。

入选理由：通过 Ollama Modelfile 可封装模型参数，简化本地模型调用流程。

精选文章#Ollama#LLM#本地模型#性能优化中文

Building a Multi-Tool Gemma 4 Agent with Error Recovery

Machine Learning Mastery5月28日3497 字 (约 14 分钟)

通过构建一个具有错误恢复机制的多工具 Gemma 4 代理，学习如何优雅地处理工具调用中的失败。

入选理由：迭代代理循环需设置最大迭代次数以防止无限循环。

精选文章#Gemma 4#工具调用#错误恢复#迭代代理英文

使用 Gemma 4 实现简易代理工具调用

KDnuggets5月23日2859 字 (约 12 分钟)

Gemma 4 模型通过本地沙箱工具实现真正代理行为，支持文件系统探索和受限 Python 解释器。

入选理由：Gemma 4 支持本地工具调用，如文件系统探索和受限 Python 执行，增强模型自主性

精选文章#Gemma 4#Agent#Tool Calling#Security#Python英文

5 Cool Things I Did with Local Language Models

KDnuggets5月18日3398 字 (约 14 分钟)

文章介绍了本地语言模型的优势，如无需API密钥、无需数据转移等。

入选理由：Local models are easier to run and maintain compared to cloud tools.

精选文章#local-language-models#cloud-comparison中文

I Built the Same B2B Document Extractor Twice: Rules vs. LLM

Towards Data Science5月14日2481 字 (约 10 分钟)

作者通过两次构建B2B文档提取器，比较了基于规则的传统方法和基于LLM的方法，探讨了复杂性和布局多样性对两种方法的影响。

入选理由：基于LLM的方法在处理复杂和多变的布局时更具优势。

精选文章#B2B#OCR#LLM#Python#Document Extraction中文

Build an AI-Powered Learning Management System That Actually Trains People

构建一个真正能培训人的AI驱动型学习管理系统

KDnuggets5月11日1903 字 (约 8 分钟)

文章介绍如何用开源工具构建AI驱动的学习管理系统，包含个性化路径、动态测验等功能。

入选理由：使用Ollama+Mistral 7B实现本地语言模型，无需云服务

精选文章#AI#LMS#React#FastAPI#Ollama英文

OpenJarvis: a local-first personal AI is now available to run with Ollama

Built by Stanford’s @Hazy...

OpenJarvis：现已可通过 Ollama 在本地运行的个人AI

ollama(@ollama)6月1日103 字 (约 1 分钟)

OpenJarvis 是由斯坦福 HazyResearch 和 Scaling Intelligence 实验室开发的本地优先个人AI，可与 Ollama 集成运行，旨在实现高效低功耗本地化AI体验，支持用户在无网络环境下使用。

入选理由：OpenJarvis 可通过 Ollama 在本地部署，无需云端连接，保障隐私与离线可用性。

精选推文#Ollama#本地AI#斯坦福#HazyResearch#Intelligence Per Watt英文

.@MiniMax_AI M3 model is available on Ollama's Cloud!

In partnership with MiniMax, the M3 model on...

MiniMax M3 模型现已上线 Ollama Cloud！

ollama(@ollama)6月1日153 字 (约 1 分钟)

MiniMax M3 模型已通过 Ollama Cloud 发布，支持 US 部署与零数据保留，专为编码和代理任务设计，在 SWE-Bench Pro 基准中达 59%+ 正确率，结合稀疏注意力实现 1M 上下文长度。

入选理由：M3 在 SWE-Bench Pro 基准中取得 59.0% 正确率，优于多数开源模型。

精选推文#M3#Ollama#MiniMax#编码 AI#代理 AI英文

We just added significantly more NVIDIA Blackwell GPUs to better serve GLM-5.1 model on Ollama's clo...

Ollama 宣布新增 NVIDIA Blackwell GPU 支持 GLM-5.1 模型

ollama(@ollama)5月15日202 字 (约 1 分钟)

Ollama 新增 NVIDIA Blackwell GPU 以更好支持 GLM-5.1 模型。

入选理由：Ollama 已扩展 NVIDIA Blackwell GPU 阵容以优化 GLM-5.1 模型性能。

精选推文#Ollama#GPU#GLM-5.1#NVIDIA#云服务英文

Peekaboo 3.0 正式发布专注操作与界面检测

AI HOT 精选5月9日203 字 (约 1 分钟)

Peekaboo 3.0 发布，带来基于 macOS 的操作自动化新功能。

入选理由：Peekaboo 3.0 是自 2.0 以来最大更新

精选文章#macOS#自动化#工具中文

Ollama 推出本地优先个人 AI 工具 OpenJarvis

ollama(@ollama)6月1日48 字 (约 1 分钟)

Ollama 发布 OpenJarvis，支持在本地运行大模型，无需联网，提升隐私与响应速度，适配开发者与企业用户。

入选理由：OpenJarvis 可通过 Ollama 在本地运行，无需联网即可访问 LLM 模型。

精选推文#Ollama#本地AI#LLM#隐私计算#开源工具英文

First open-weight model from @poolsideai! Apache license, and available on Ollama to try. 👇👇👇 m...

ollama(@ollama)5月2日145 字 (约 1 分钟)

Poolside AI 发布首款开源权重模型 Laguna XS.2（33B总参/3B激活MoE），Apache 2.0 许可，支持单卡运行，专为智能体编程与长周期任务优化。

入选理由：Laguna XS.2 是 Poolside AI 首个开源权重模型，采用 MoE 架构

精选推文#AI#open-weight#MoE#Ollama#Poolside AI中文

> Ecosystem: Compatible with llama.cpp, MLX, @LMStudio, vLLM, @ollama, @UnslothAI, and SGLang.
&g...

Google AI Developers：Gemma 4 生态兼容与下载

Google AI Developers(@googleaidevs)6月4日78 字 (约 1 分钟)

Google 宣布其模型权重与主流开源生态兼容，可在 Hugging Face 和 Kaggle 直接下载，降低部署门槛。

入选理由：Gemma 4 权重与 llama.cpp、vLLM、Ollama 等生态兼容，便于本地部署与推理。

精选推文#Gemma#开源生态#模型部署#Hugging Face#Kaggle英文

Odysseus + Gemma-4 26B & FREE APIs: RIP Hermes & OpenClaw! THIS IS CRAZY!

AICodeKing6月2日1562 字 (约 7 分钟)

PewDiePie推出的Odysseus AI工作区是一款可自托管的AI工具，支持Gemma-4 26B等模型，提供代理模式、深度研究和文档编辑功能，但缺乏技术深度分析和性能数据。

入选理由：Odysseus支持Gemma-4 26B模型，本地运行需至少16GB内存，可通过Ollama快速部署

精选视频#AI工具#自托管#Gemma-4#Ollama#AI工作区英文

Ollama now supports Codex app!

To try it, update to the latest Ollama 0.24, and run:

ollama laun...

Ollama 现在支持 Codex 应用！

ollama(@ollama)5月15日81 字 (约 1 分钟)

Ollama 0.24 新增对 Codex 应用的支持，用户可通过命令行启动。

入选理由：更新至 Ollama 0.24 后可使用 codex-app 功能。

精选推文#Ollama#Codex#AI 模型#开源英文

Some models to try with Codex

ollama(@ollama)5月15日175 字 (约 1 分钟)

Ollama 推荐了多个与 Codex 配合使用的模型，包括支持视觉的 kimi-k2.6 和 glm-5.1。

入选理由：kimi-k2.6 支持视觉功能，适合图像相关任务。

精选推文#Codex#AI 模型#Ollama英文

Ollama 推出 GLM-5.1

ollama(@ollama)5月15日66 字 (约 1 分钟)

Ollama 推出新一代旗舰模型 GLM-5.1，代码生成能力显著提升。

入选理由：GLM-5.1 是 Ollama 的新一代旗舰模型。

精选推文#AI 模型#代码生成#Ollama英文

ollama 发布 Hermes Agent

ollama(@ollama)6月4日50 字 (约 1 分钟)

ollama 发布了 Hermes Agent，一个用于生成代码的 AI 工具。

入选理由：ollama 发布了 Hermes Agent，一个用于生成代码的 AI 工具。

精选推文#AI#编程语言#框架中文

@GoogleDeepMind's Gemma 4 - 12B is available on Ollama!

ollama(@ollama)6月4日104 字 (约 1 分钟)

ollama 宣布 Gemma 4 - 12B 模型已在其平台上可用。用户可以通过 MLX 运行该模型，支持 Hermes Agent 和 Claude Code 等工具。

入选理由：ollama 宣布 Gemma 4 - 12B 模型已在其平台上可用。

精选推文#ollama#Gemma 4#MLX中文

🤯 Ollama now supports Claude Desktop via Claude’s built-in third party inference.

ollama launch cl...

🤯 Ollama 现已通过 Claude 内置第三方推理支持 Claude Desktop

ollama(@ollama)5月6日133 字 (约 1 分钟)

Ollama新增支持Claude Desktop的第三方推理接口，允许在Claude桌面应用中调用Ollama云端模型，但仅属功能集成公告，无技术深度或实践指导。

入选理由：Ollama现在可通过命令行启动claude-desktop集成Claude桌面端。

精选推文#Ollama#Claude#LLM#推理#桌面英文

Ollama 发布 Minima 模型页面：但内容空洞无技术细节

ollama(@ollama)6月1日36 字 (约 1 分钟)

Ollama 在 X 平台发布 Minima 模型页面链接，但未提供模型架构、性能或部署方法，信息密度极低。

入选理由：Ollama 提供 Minima 模型页面（ollama.com/library/minima）供用户下载和运行轻量模型。

精选推文#Ollama#大模型#开源#模型库英文

@ollama 🚀

NVIDIA AI(@NVIDIAAI)5月16日29 字 (约 1 分钟)

NVIDIA AI 在 X 平台发布了一条关于 @ollama 的推文，但内容缺乏具体技术细节。

入选理由：NVIDIA AI 在 X 平台上发布了与 @ollama 相关的内容。

精选推文#NVIDIA#AI#X平台中英混合

Restore to existing Codex experience without any effects:

ollama launch codex-app --restore

恢复 Codex 初始体验

ollama(@ollama)5月15日52 字 (约 1 分钟)

Ollama 提供了恢复 Codex 默认设置的命令。

入选理由：使用 `ollama launch codex-app --restore` 可以恢复 Codex 的默认设置。

精选推文#Codex#Ollama#CLI英文

@lemonkillergame 没有降智，减量，但是用户多了，我们也每天在打拼弄新的GPU上线。变慢了，抱歉！希望很快就可以解决了

ollama(@ollama)5月6日265 字 (约 2 分钟)

Ollama官方回应服务变慢问题，称未降低模型质量或缩减资源，而是因用户量激增，正在加紧部署新GPU以缓解性能压力。

入选理由：服务变慢并非由于降智或减量，模型能力保持不变。

精选推文#Ollama#GPU中英混合

We are now enabling a queue for DeepSeek v4 Pro, expect longer time-to-first-token instead of degrad...

ollama(@ollama)5月2日174 字 (约 1 分钟)

Ollama 宣布为 DeepSeek v4 Pro 启用请求队列机制，以避免服务降级，但将导致更长的首 token 延迟。

入选理由：启用队列是应对高负载的临时策略，非性能优化

精选推文#Ollama#DeepSeek#LLM#Serving中文

At any point in time, you can safely resume to using Anthropic's models:

ollama launch claude-desk...

在任何时间点，您都可以安全地恢复使用 Anthropic 的模型：ollama launch claude-desktop --restore

ollama(@ollama)5月6日159 字 (约 1 分钟)

Ollama 推出命令行工具支持恢复使用 Anthropic 的 Claude 模型，但仅是功能提示，无技术深度或架构说明，信息密度极低。

入选理由：Ollama 支持通过 `ollama launch claude-desktop --restore` 恢复使用 Anthropic 的模型。

精选推文#Ollama#Claude#Anthropic#CLI#本地大模型英文

Documentation https://t.co/xwEudxT6Qg

ollama(@ollama)5月6日127 字 (约 1 分钟)

该内容仅为Ollama在X平台发布的文档链接推文，无实质性技术信息，仅引导用户访问外部文档页面，缺乏机制、原理或实践指导。

入选理由：该内容仅为Ollama在X平台发布的文档链接推文，无实质性技术信息，仅引导用户访问外部文档页面，缺乏机制、原理或实践指导

精选推文英文

Model page: https://t.co/a2JkIGlQjJ

ollama(@ollama)5月2日49 字 (约 1 分钟)

该推文仅包含一条短链接和平台导流文案，无实质性技术内容、模型参数、架构说明或使用指南。

入选理由：未提供任何可操作的技术信息

精选推文#Ollama#AI#模型部署中文

跨材料问答 · Ollama

回答基于：Ollama 相关 30 条材料