Gemini 3.5 Flash:更贵了,但谷歌计划用它做所有事
Google发布Gemini 3.5 Flash,定价是前代Flash-Lite的6倍,却广泛部署于搜索、AI助手和企业平台,反映大模型厂商正通过高价模型试探API客户支付意愿。
入选理由:Gemini 3.5 Flash输入价格为$1.50/百万token,输出为$9/百万token,是3.1 Flash-Lite的6倍。
模型
别名:3.1 Pro
Google发布的闭源大语言模型。
已跟踪 22 条高相关材料
最近变化
2026-06-02 · M3在SWE-Bench Pro上得分59%,超越GPT-5.5和Gemini 3.1 Pro
为什么值得关注
Gemini 3.1 Pro 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。
Gemini 3.5 Flash: more expensive, but Google plan to use it for everything
Simon Willison's Weblog · 8.7 分
Google发布Gemini 3.5 Flash,定价提升至3.1 Flash-Lite的6倍,却广泛部署于搜索、AI助手和企业平台,反映大模型厂商正通过高价模型试探API客户支付意愿,同时性能与成本显著高于前代产品。
MiniMax M3一手实测:老黄PPT上74个Logo,我以为能难住它
量子位 · 8.5 分
MiniMax M3是国内首个同时具备长上下文、多模态与Coding能力的开源模型,实测在SWE-Bench Pro上跑出59%成绩,超越GPT-5.5和Gemini 3.1 Pro,效率达上代1/20。
Can LLMs generate Enterprise Quality Code? — Prasenjit Sarkar, Sonar
AI Engineer · 8.5 分
LLMs生成的代码虽功能通过率高(如Gemini 3.1 Pro达84.17%),但存在严重可维护性与安全缺陷,Sonar用4,444个Java任务评估发现其每百万行代码含614个bug,且代码冗长、复杂度高。
已收录 22 条与 Gemini 3.1 Pro 相关的内容,按评分排序。
Google发布Gemini 3.5 Flash,定价是前代Flash-Lite的6倍,却广泛部署于搜索、AI助手和企业平台,反映大模型厂商正通过高价模型试探API客户支付意愿。
入选理由:Gemini 3.5 Flash输入价格为$1.50/百万token,输出为$9/百万token,是3.1 Flash-Lite的6倍。
MiniMax M3是国内首个同时具备长上下文、多模态与Coding能力的开源模型,实测在SWE-Bench Pro上跑出59%成绩,超越GPT-5.5和Gemini 3.1 Pro,效率达上代1/20。
入选理由:M3在SWE-Bench Pro上得分59%,超越GPT-5.5和Gemini 3.1 Pro
LLMs生成的代码虽功能通过率高(如Gemini 3.1 Pro达84.17%),但存在严重可维护性与安全缺陷,Sonar用4,444个Java任务评估发现其每百万行代码含614个bug,且代码冗长、复杂度高。
入选理由:Gemini 3.1 Pro在SWE Bench测试中功能通过率达84.17%,但生成代码冗长(307,000行)且复杂度高(圈复杂度234)。
测试包括与 Gemini 和 GLM 的对比,涵盖多种场景。
入选理由:Claude Opus 4.8 在 200 多项前端测试中胜过 Gemini 3.1 Pro 和 GLM 5.1。
腾讯混元开源Hy-MT2翻译模型,提供33种语言互译,7B和30B-A3B模型达开源最佳效果,1.8B模型超商业API,支持1.25-bit量化仅需440MB存储。
入选理由:Hy-MT2的7B和30B-A3B模型在翻译任务中达到开源最佳效果,超越数十倍参数量模型
AI使教育科技门槛降低,个人仅需少量成本即可开发高质量3D教育应用。
入选理由:2020年开发同类应用需80万美元,2026年只需不到10美元。
百度发布文心5.1,以6%预训练成本登顶国内搜索榜,Agent能力超DeepSeek-V4-Pro,创意写作媲美Gemini 3.1 Pro。
入选理由:文心5.1预训练成本仅为业界同规模模型的6%,显著降低AI训练门槛。
Physics-Intern 框架通过多智能体协作将 Gemini 3.1 Pro 在 CritPt 基准上的表现从 17.7% 提升至 31.4%,创下理论物理推理新 SOTA。
入选理由:Physics-Intern 使用多智能体协作框架解决复杂理论物理问题。
文章分析了文本竞技场排名前五的实验室及其模型,展示了前沿模型在不同领域的优势和权衡。AnthropicAI的Claude Opus 4.7表现最为全面,而Google DeepMind的Gemini 3.1 Pro在创意写作方面尤为突出。
入选理由:AnthropicAI的Claude Opus 4.7在几乎所有主要类别中都表现出色,是最具统治力的模型。
开源模型MiniMax M3已达到与GPT-5.5和Opus 4.7相当的性能,尤其在编码任务上优于Gemini 3.1 Pro,且成本仅为它们的1/10,其权重将于下周在Hugging Face开放。
入选理由:MiniMax M3在SWE Bench Pro上与GPT-5.5性能相当
Gemini 3.5 Flash在视觉任务上超越3.1 Pro版本,平均速度快6倍,展现了多模态理解能力优势。该性能提升对实时视觉应用具有重要意义。
入选理由:Gemini 3.5 Flash在视觉任务上表现优于3.1 Pro版本
AI 可通过 GenSpark 平台调用多个专业代理(如研究、语音脚本、呼叫代理等)自动拨打 100 个英国水管工电话,以验证其作为 24/7 接待员的商业化潜力;实验中 AI 成功引导用户跳转至预约页面,但未披露最终转化数据。
入选理由:使用 GenSpark 构建多代理 AI 系统,整合研究、Stripe、语音脚本、呼叫、收件箱等 6 类代理。
Philipp Schmid利用GoogleDeepMind的Gemini 3.1 Pro观看cursor_ai SDK的发布视频并生成制作脚本,随后使用Remotion无提示重现视频,展示其视频理解能力。
入选理由:Gemini 3.1 Pro能够理解视频内容并创建生产脚本。
Google DeepMind发布的Gemini 3.5 Flash在Code Arena前端编码评估中取得突破性成绩,得分1507分,较3 Flash提升70分,并超越3.1 Pro版本,同时输出速度提升2倍以上。
入选理由:Gemini 3.5 Flash在Code Arena: Frontend评估中得分1507分,较Gemini-3 Flash提升70点
文章介绍了Pareto Code概念,通过真实市场需求重新定义帕累托前沿,DeepSeek V4 Pro目前排名第一。
入选理由:Pareto Code基于真实市场数据优化模型选择
Philipp Schmid展示了一个使用@stripe Link重建的示例,通过1个指令和15分钟完成相同工作流程,展示了AI辅助视频创作的能力。
入选理由:Philipp Schmid使用Gemini 3.1 Pro观察cursor_ai SDK的发布视频并生成制作脚本。
Google发布Gemini Flash 3.5,模型效果超越3.1 Pro,性能指标接近GPT-5.5,在Agentic和多模态方面更具优势,价格仅为GPT-5.5的三分之一,上下文窗口达1M token。
入选理由:Gemini Flash 3.5模型效果大幅超越3.1 Pro,性能指标与GPT-5.5接近,在Agentic和多模态能力上优于GPT-5.5
Google DeepMind 发布的 Gemini 3.5 Flash 模型已在 OpenRouter 平台上线,在编码、代理任务和工具使用方面超越 Gemini 3.1 Pro,同时保持 Flash 级别的价格和速度优势。
入选理由:Gemini 3.5 Flash 在编码、代理任务和工具使用方面超越 Gemini 3.1 Pro
Google 发布 Gemini 3.5 Flash 模型,强调速度与能力的平衡。相比 3.1 Pro,新模型在几乎所有基准测试中表现更好,尤其在编程任务上有巨大进步,现已通过 API 和产品全面开放。
入选理由:Gemini 3.5 Flash 模型现已上线,平衡了高速度与高性能。
SWEbench 基准测试已失效,GPT 5.5 在 Deep Suite 上以 70% 准确率领先 Opus 4.7 的 54%,而 SWEbench 显示相反趋势,表明基准不可靠。
入选理由:GPT 5.5 achieves 70% accuracy on Deep Suite, significantly outperforming Opus 4.7 at 54%.
文章介绍使用AI工具生成3D生物结构并构建交互式应用的案例,但缺乏技术深度。
入选理由:使用GPT Images 2生成3D生物结构
这是一则关于 Gemini 3.5 Flash 正式发布的简短推文,仅列举产品卖点,未提供技术细节、基准数据或架构信息,信息密度极低。
入选理由:Gemini 3.5 Flash 已 GA(正式发布),主打 agents 和 coding 场景