Gemma 4 12B:开发者指南
Gemma 4 12B采用无编码器多模态架构,可在16GB显存设备上本地运行并原生支持音频输入。该模型通过移除独立视觉与音频编码器显著降低延迟,配合专用MTP模型提升推理速度,是首个支持macOS桌面端全离线交互的中型多模态模型。
入选理由:Gemma 4 12B移除独立编码器,视觉仅用35M参数嵌入层,音频直接线性投影至LLM输入空间
产品
别名:Opencode 项目
基于 North Mini Code 的代码代理平台。
已跟踪 23 条高相关材料
最近变化
2026-06-09 · 文章未提供具体技术细节或实用建议。
为什么值得关注
OpenCode 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。
Gemma 4 12B: The Developer Guide
Google Developers Blog · 9.2 分
Gemma 4 12B采用无编码器多模态架构,可在16GB显存设备上本地运行并原生支持音频输入。该模型通过移除独立视觉与音频编码器显著降低延迟,配合专用MTP模型提升推理速度,是首个支持macOS桌面端全离线交互的中型多模态模型。
Introducing North Mini Code: Cohere’s First Model For Developers
Hugging Face Blog · 8.5 分
Cohere 发布 North Mini Code,一个 30B 参数的 Mixture-of-Experts 模型,专为开发者设计,在多个代码生成基准测试中表现优异。
Opencode 深度研究报告生成 Skill 传统深度调研成本高,行业报告按份 $50–500+,个人研究者/独立开发者无力承担;AI 直接调研又太浅(搜几条摘要就出结论)或编造数字。 这个项目...
Geek(@geekbb) · 8.5 分
Opencode 项目通过四阶段流水线生成高质量深度研究报告,成本低至 $10–20,媲美专业机构。
已收录 23 条与 OpenCode 相关的内容,按评分排序。
Gemma 4 12B采用无编码器多模态架构,可在16GB显存设备上本地运行并原生支持音频输入。该模型通过移除独立视觉与音频编码器显著降低延迟,配合专用MTP模型提升推理速度,是首个支持macOS桌面端全离线交互的中型多模态模型。
入选理由:Gemma 4 12B移除独立编码器,视觉仅用35M参数嵌入层,音频直接线性投影至LLM输入空间
Cohere 发布 North Mini Code,一个 30B 参数的 Mixture-of-Experts 模型,专为开发者设计,在多个代码生成基准测试中表现优异。
入选理由:North Mini Code 是 Cohere 首个专为开发者设计的模型,参数量为 30B,其中 3B 为活跃参数。
Opencode 项目通过四阶段流水线生成高质量深度研究报告,成本低至 $10–20,媲美专业机构。
入选理由:Opencode 项目采用四阶段流水线(大纲→数据采集→并行撰写→验收装配)生成高质量研究报告。
吴恩达指出,AI 正在创造新岗位,但长期来看企业内部 AI Engineer 数量将远超厂商派驻的 FDE;当前最抢手的是能搭建应用、熟练使用 AI 编程工具的通才型 AI 工程师,而非深度绑定单一厂商的 F代。
入选理由:企业更倾向培养自有 AI Engineer 而非依赖外部 FDE,如吴恩达团队‘招 FDE 但招更多 AI Engineer’。
Geek 发布了一个 Electron 桌面应用,内置 OpenCode,为嵌入式开发提供集成 AI 编码代理的桌面工作区,支持 Arduino、ESP32、RP2040 等单片机的编程、编译、烧录,并能查看串口日志和波形图。
入选理由:Geek 发布了 Electron 桌面应用
Semble 是一个为代理设计的代码搜索库,使用 ~98% 更少的 token 提供快速准确的代码片段。
入选理由:Semble 可以在 CPU 上运行,无需 API 密钥或 GPU。
Agent Harness 是决定 AI 模型能否真正执行任务的关键工程系统,包括工具、权限、上下文、执行环境和结果验证。
入选理由:Agent Harness 决定了 AI 模型能否执行实际任务,而不仅仅是提供建议。
在M4芯片MacBook上使用LM Studio运行Qwen 3.5-9B(q4_k_s量化版本),可实现约40 tokens/秒推理速度,支持128K上下文和工具调用。
入选理由:Qwen 3.5-9B (q4_k_s) 在M4 Mac上以40 tokens/秒速度运行,支持128K上下文和工具使用
Models.dev 是一个由社区共建的开源数据库,集中整理 AI 模型的规格、定价与能力信息,并提供 API 与标准化 TOML 数据结构,支持快速集成与更新。
入选理由:API 可通过 curl https://models.dev/api.json 获取,Model ID 与 AI SDK 兼容。
Martin Fowler 讨论了使用各种传感器来监测和改进代码库的维护性,重点关注功能正确性、架构适应性和内部质量。
入选理由:Maintainability involves making it easy and low-risk to change the codebase over time.
阿里推出Qwen-3.7-Max模型,在成本和性能上显著优于GPT-5.5和Opus 4.7,支持与Hermes Agent或OpenCode集成。
入选理由:Qwen-3.7-Max输出价格比Opus 4.7便宜3.3倍,比GPT-5.5便宜4倍。
xAI 宣布 Grok 和 X Premium 用户可在 OpenCode 中使用 Grok Build 模型,提升代码处理速度与智能。
入选理由:Grok Build 模型现支持 OpenCode 平台集成。
X Premium 会员现已支持 Openclaw、Opencode 和 Hermes 的授权登录,用户可用 Grok 配额驱动这些产品。
入选理由:X Premium 用户现可通过授权登录使用 Openclaw、Opencode 和 Hermes。
Waza 工具链更新,支持多个 AI 编程助手,发布流程自动化,但信息密度较低。
入选理由:Waza 现在支持 Antigravity、OpenCode 和 Pi 等平台。
Gemini 3.5 Flash 已上线 OpenCode 平台,宣称速度极快、支持 1M 上下文,定价与 GLM、Kimi、DeepSeek Pro 相当,但缺乏技术细节与实测验证,属低信息密度产品公告。
入选理由:Gemini 3.5 Flash 在 OpenCode 平台上线,支持 1M 上下文长度。
文章内容信息密度低,缺乏技术深度和实用价值,主要为社交媒体上的简短介绍。
入选理由:文章未提供具体技术细节或实用建议。
Cohere 宣布其首个编码模型 North Mini Code 免费开放,支持 256K 上下文长度。
入选理由:North Mini Code 是 Cohere 的首个编码模型。
MiniMax M3 即将发布,开发者将在自有编码代理和测试框架中进行深度测试,评测即将推出;OpenCode 平台已提供免费试用。
入选理由:MiniMax M3 即将发布,预计在 OpenCode 平台上线。
Qwen 3.6 Plus 在 OpenCode 平台再次免费开放。
入选理由:Qwen 3.6 Plus 再次免费开放
DeepSeek官方推文宣布V4-Pro API限时75折优惠至2026年5月5日,并列出Claude Code、OpenCode、OpenClaw三项集成更新要求。
入选理由:DeepSeek-V4-Pro API提供为期数日的75%折扣,截止时间为UTC时间2026年5月5日15:59
DeepSeek 官方宣布将 V4-Pro 模型 API 的 75% 折扣延长至 2026 年 5 月 31 日,并更新了 Claude Code、OpenCode 和 OpenClaw 的集成适配版本。
入选理由:DeepSeek-V4-Pro API 75% 折扣有效期延至 2026 年 5 月 31 日 UTC
MiniMax M3 即将上线,当前可在 OpenCode 平台免费试用;但文章仅含发布通知,缺乏技术细节与实测数据,实用性有限。
入选理由:MiniMax M3 将于近期上线,当前可通过 OpenCode 平台免费体验
OpenCode 宣布已集成 Grok,X Premium 用户可直接调用 Grok Build 模型进行代码生成与调试。
入选理由:X Premium 订阅者无需额外付费即可在 OpenCode 内使用 Grok Build