推出 Gemma 4 12B:面向本机的统一、无编码器多模态模型
Gemma 4 12B 是面向本机运行的统一、无编码器多模态模型,将视觉与音频直接接入 LLM,性能接近 26B MoE 但内存仅其一半,可在 16GB VRAM 紧凑设备上运行,支持离线语音处理与低延迟多步推理。
入选理由:Gemma 4 12B 性能接近 26B MoE,内存仅其一半,适合在 16GB VRAM 现代本机运行。
产品
别名:lm-studio
一个图形界面工具,用于本地运行和比较大语言模型。
已跟踪 4 条高相关材料
最近变化
2026-06-10 · 使用 llama.cpp 可在消费级硬件上运行大型模型,支持 4-bit 量化。
为什么值得关注
LM Studio 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。
Introducing Gemma 4 12B: a unified, encoder-free multimodal model
The Keyword (blog.google) · 8.7 分
Gemma 4 12B 是面向本机运行的统一、无编码器多模态模型,将视觉与音频直接接入 LLM,性能接近 26B MoE 但内存仅为其一半,可在 16GB VRAM 紧凑设备上运行,支持离线语音处理与低延迟多步推理。
How to Run LLMs Locally (Great For Learning and Privacy)
ByteByteGo · 8.5 分
本地运行大语言模型(LLMs)可通过 llama.cpp、Ollama 和 LM Studio 等工具实现,兼顾隐私与学习。
Zed + Gemma-4 12B & Qwen-3.6: HOW IS THIS POSSIBLE?! THIS IS CRAZY!
AICodeKing · 8.5 分
Zed现在支持直接在编辑器中使用本地AI模型,如Gemma-4 12B和Qwen-3.6,提升隐私和实验效率。
已收录 4 条与 LM Studio 相关的内容,按评分排序。
Gemma 4 12B 是面向本机运行的统一、无编码器多模态模型,将视觉与音频直接接入 LLM,性能接近 26B MoE 但内存仅其一半,可在 16GB VRAM 紧凑设备上运行,支持离线语音处理与低延迟多步推理。
入选理由:Gemma 4 12B 性能接近 26B MoE,内存仅其一半,适合在 16GB VRAM 现代本机运行。
本地运行大语言模型(LLMs)可通过 llama.cpp、Ollama 和 LM Studio 等工具实现,兼顾隐私与学习。
入选理由:使用 llama.cpp 可在消费级硬件上运行大型模型,支持 4-bit 量化。
Zed现在支持直接在编辑器中使用本地AI模型,如Gemma-4 12B和Qwen-3.6,提升隐私和实验效率。
入选理由:Zed支持通过LM Studio/Ollama/llama.cpp集成本地模型
在M4芯片MacBook上使用LM Studio运行Qwen 3.5-9B(q4_k_s量化版本),可实现约40 tokens/秒推理速度,支持128K上下文和工具调用。
入选理由:Qwen 3.5-9B (q4_k_s) 在M4 Mac上以40 tokens/秒速度运行,支持128K上下文和工具使用