Gemma 4 12B:开发者指南
Gemma 4 12B采用无编码器多模态架构,可在16GB显存设备上本地运行并原生支持音频输入。该模型通过移除独立视觉与音频编码器显著降低延迟,配合专用MTP模型提升推理速度,是首个支持macOS桌面端全离线交互的中型多模态模型。
入选理由:Gemma 4 12B移除独立编码器,视觉仅用35M参数嵌入层,音频直接线性投影至LLM输入空间
公司
别名:谷歌
美国科技公司,开发了Gmail等创新产品。
已跟踪 30 条高相关材料
最近变化
2026-06-10 · Gemini 3.5 Live Translate 支持 70 多种语言的实时翻译。
为什么值得关注
Google 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。
Gemma 4 12B: The Developer Guide
Google Developers Blog · 9.2 分
Gemma 4 12B采用无编码器多模态架构,可在16GB显存设备上本地运行并原生支持音频输入。该模型通过移除独立视觉与音频编码器显著降低延迟,配合专用MTP模型提升推理速度,是首个支持macOS桌面端全离线交互的中型多模态模型。
New research from Google. Just shows the impressive results you can get from custom agent harnesses...
elvis(@omarsar0) · 8.8 分
Google 的 LEAP 框架以通用 LLM 为核心,结合 Lean 编译器与验证器反馈,将 Lean-IMO-Bench 一次求解率从低于10%提升至70%,并一模型解决全部 Putnam 2025 题目,超越专门系统48分。
今天被很多人忽略的大新闻 Google 发布实时翻译模型 :Gemini 3.5 Live Translate - 能在70多种语言之间做到边听边译 - 同时保留说话人的语调、节奏和音高 - 不用...
小互(@imxiaohu) · 8.5 分
Google 推出 Gemini 3.5 Live Translate 实时翻译模型,支持 70 多种语言边听边译,保留语调和节奏。
已收录 30 条与 Google 相关的内容,按评分排序。
Gemma 4 12B采用无编码器多模态架构,可在16GB显存设备上本地运行并原生支持音频输入。该模型通过移除独立视觉与音频编码器显著降低延迟,配合专用MTP模型提升推理速度,是首个支持macOS桌面端全离线交互的中型多模态模型。
入选理由:Gemma 4 12B移除独立编码器,视觉仅用35M参数嵌入层,音频直接线性投影至LLM输入空间
Google 的 LEAP 框架将通用 LLM 与形式化数学编译器 Lean 及验证器结合,使 Lean-IMO-Bench 一次求解率从低于10%提升至70%,并以一模型解决 Putnam 2025 全部 12 题,超越专门化金牌系统。
入选理由:LEAP 通用 LLM 一模型解决全部 12 道 Putnam 2025 题。
Antigravity 提供四种不同工具表面,分别适用于不同开发场景,开发者可根据需求选择最适合的工具。
入选理由:Antigravity 2.0 适合管理多个项目并行任务。
Google 推出 Gemini 3.5 Live Translate 实时翻译模型,支持 70 多种语言边听边译,保留语调和节奏。
入选理由:Gemini 3.5 Live Translate 支持 70 多种语言的实时翻译。
Google 推出 Gemini 3.5 Live Translate,支持 70 多种语言的实时低延迟语音翻译。
入选理由:Gemini 3.5 Live Translate 支持 70 多种语言的实时低延迟翻译。
谷歌发布 Gemma 4 QAT 模型,内存占用减少 3 倍,可在手机和笔记本电脑上运行。
入选理由:Gemma 4 E4B 模型仅需 2GB RAM 即可在手机上运行。
Gemini 3.5 实时翻译功能已上线,支持 70 多种语言,实现自然流畅的语音翻译。
入选理由:Gemini 3.5 支持 70+ 种语言和 2000+ 语言对的实时翻译。
谷歌在语音翻译领域取得重大进展,Gemini 3.5 Live Translate 支持 70 多种语言,提升跨语言交流体验。
入选理由:Gemini 3.5 Live Translate 支持 70+ 种语言。
现代AI依赖于专用硬件如GPU、TPU和NPU,它们在并行计算和大规模数据处理上表现优异。
入选理由:AI训练需要执行万亿次数学运算,传统CPU无法高效完成。
Cloudflare 推出 AI Gateway 花费控制功能,帮助企业管理 AI 使用成本并实现精细化预算分配。
入选理由:Cloudflare AI Gateway 可统一管理多个 AI 提供商的账单和使用情况。
2026年AI行业进入估值跳涨与价值重估并存的拐点,创业者需关注垂类应用、具身智能及AI硬件等方向。
入选理由:2026年AI行业估值跳涨与价值重估并存,创业者需谨慎选择赛道。
EVA-Bench数据2.0扩展至3个领域,覆盖213个场景,提升评估全面性。
入选理由:新增医疗HR服务领域,总场景数达213个(+4倍)
Google推出创作者专用资料页提升搜索可见性,通过自定义展示方式增强内容曝光。
入选理由:Google推出创作者专用资料页提升搜索可见性
Google与犹他州教育委员会合作,将Gemini for Education工具免费提供给所有K-12学校,覆盖100万学生。
入选理由:Gemini for Education将覆盖犹他州所有K-12学校(约100万学生)
Google推出Gemma 4 QAT模型,通过量化训练优化移动设备效率,内存占用降低至1GB。
入选理由:QAT技术使Gemma 4 E2B模型内存占用降至1GB
研究表明,随着AI聊天机器人和社交媒体的普及,人类注意力平均从2003年的两分半钟降至2020年的47秒,频繁切换注意力导致压力升高、工作效率下降,并可能对儿童产生成瘾风险。
入选理由:2003年平均注意力为2.5分钟,2012年降至75秒,2020年进一步降至47秒。
谷歌工程师通过20%项目开发Gmail,颠覆传统邮箱体验,引入搜索功能和1GB存储。
入选理由:Gmail的1GB存储空间在2004年远超其他邮箱服务的MB级。
Gemini 3.5 Flash 能够处理复杂视觉数据并生成可交互代码,适用于3D可视化等场景。
入选理由:Gemini 3.5 Flash 可分析参考图像中的光照信息。
AI Agent 正在将机器人流量从“垃圾”转变为“价值”,因为它们能代表人类完成浏览、比价和购买,这要求企业将网页设计从视觉导向转向结构化数据导向。
入选理由:AI Agent 优先关注结构化数据、清晰定价和产品匹配度,而非视觉品牌或 Hero Image。
Google正以每月9.2亿美元向SpaceX租用11万块Nvidia GPU,总合同价值达300亿美元,这表明即使拥有自研TPU和庞大云基础设施,其AI算力需求也已远超自身建设速度,或SpaceX已暗中构建了顶级AI算力设施。
入选理由:Google与SpaceX签署云服务协议,每月支付9.2亿美元租用11万块Nvidia GPU。
AI生成诉讼导致美国法院案件量翻倍但未提升胜诉率,Google资助虚拟电厂项目通过聚合EV与恒温器负荷为数据中心供电,欧盟拟立法限制大型科技公司依赖并引入服务“终止开关”。
入选理由:美国联邦法官反馈AI使无律师诉讼文件数量较2023年前翻倍,但并未提高当事人胜诉概率。
Simon Willison 转载 404 Media 汇总的 Google 员工声明修正:原称“AI 决策需人类在回路”,后被要求撤回,体现企业对外沟通策略的调整与透明度考量。
入选理由:Google 员工原声明称 AI 决策需“人类在回路”,后被要求撤回。
Gemini 3.5 Flash 能够精准还原早期 2000 年代 PC 绘图体验,展示了其强大的图像生成能力。
入选理由:Gemini 3.5 Flash 一次生成即可还原经典早期 2000 年代 PC 绘图风格。
Creatify AI 推出新功能,允许用户通过单一工具创建广告并直接启动完整营销活动。
入选理由:Creatify AI 的 Wave 2 版本支持从广告创建到活动启动的全流程自动化。
Google 推出 Gemini 3.5 Flash 实时语音翻译模型,支持 70 多种语言,但信息密度较低。
入选理由:Gemini 3.5 Flash 支持 70 多种语言的实时语音翻译。
文章内容信息密度低,主要为新闻汇总,缺乏技术深度与实用性。
入选理由:OpenAI计划在IPO前将ChatGPT转变为超级应用。
Anthropic曾试图通过游说政府监管AI来影响特朗普的政策,但最终未能成功。
入选理由:特朗普最初支持AI发展,但后来因监管问题推迟了行政命令。
权力格局正在发生转移:Google 在市值上重新领先 Microsoft,Gen Z YouTuber 正在颠覆好莱坞的传统电影发行机制,而 Microsoft 的 AI 设备愿景在竞争中优于 Nvidia 的 Project Solara。
入选理由:Google 目前在市值增长上已领先于 Microsoft,且通过向 Berkshire Hathaway 发行股权采取了独特的资本策略。
Google Gemini 现已推出 macOS 应用,允许用户通过同时按下两个 Command 键快速截屏并附加到聊天窗口,简化了获取屏幕内容帮助的流程。
入选理由:Gemini macOS 应用支持通过双击 Command 键快速附加当前窗口到聊天。
该推文以戏谑口吻对比微软、OpenAI、Anthropic 和 Google 在 AI 领域的动态,但缺乏具体机制、数据或实践建议,信息密度低,对工程师阅读价值有限。
入选理由:微软宣称发布多款新模型并升级 Copilot,但未提供技术细节或性能数据。