Gemini 3.5 Flash：更贵了，但谷歌计划用它做所有事

Simon Willison's Weblog

Simon Willison's Weblog2026年5月19日

Gemini 3.5 Flash：更贵了，但谷歌计划用它做所有事

8.7Score

TL;DR · AI 摘要

Google发布Gemini 3.5 Flash，定价是前代Flash-Lite的6倍，却广泛部署于搜索、AI助手和企业平台，反映大模型厂商正通过高价模型试探API客户支付意愿。

核心要点

Gemini 3.5 Flash输入价格为$1.50/百万token，输出为$9/百万token，是3.1 Flash-Lite的6倍。
人工分析基准显示，Gemini 3.5 Flash运行成本($1,551.60)高于3.1 Pro Preview($892.28)，性价比存疑。
Google在搜索、Gemini App、Android Studio和企业平台全量部署该模型，表明其战略重心已转向内部高频调用而非仅API销售。

结构提纲

按章节快速跳转。

§Gemini 3.5 Flash正式发布
Google在I/O大会上直接发布Gemini 3.5 Flash，跳过预览阶段，面向全球用户、开发者和企业全面上线。
§价格大幅上涨且性价比存疑
Gemini 3.5 Flash价格是前代Flash-Lite的6倍，运行成本甚至超过更强大的3.1 Pro版本，引发成本效率质疑。
§Google内部大规模部署策略
尽管价格高昂，Google仍将其部署于搜索、AI助手和开发工具中，表明其目标是内部服务优化而非单纯API收入。
§行业价格趋势与竞争对标
OpenAI、Anthropic同步提价，GPT-5.5和Claude Opus 4.7成本更高，显示大模型厂商集体试探客户支付阈值。
§模型能力与输出示例
支持百万级输入token和Interactions API，生成SVG示例显示其视觉生成能力虽有创意但存在结构缺陷。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

Gemini 3.5 Flash发布与战略意义
- 技术规格
  - 模型ID: gemini-3.5-flash
  - 输入token: 1,048,576 | 输出token: 65,536
  - 知识截止: 2025年1月
- 定价与成本
  - 价格是3.1 Flash-Lite的6倍
  - 运行成本高于3.1 Pro Preview
- 战略部署
  - 部署于Google搜索、Gemini App
  - 集成至Android Studio与企业平台

金句 / Highlights

值得收藏与分享的关键句。

Gemini 3.5 Flash的价格是Gemini 3.1 Flash-Lite的6倍，达到$1.50/百万输入token和$9/百万输出token。
— 价格部分
⬇︎ 下载 PNG 𝕏 分享到 X
运行人工分析基准的成本显示，Gemini 3.5 Flash ($1,551.60) 比 Gemini 3.1 Pro Preview ($892.28) 更昂贵，颠覆了‘Flash=低成本’的预期。
— 成本对比部分
⬇︎ 下载 PNG 𝕏 分享到 X
Google将本应昂贵的模型部署于免费搜索和Gemini App，暗示其战略重心已从API收费转向通过模型提升核心产品体验与用户粘性。
— 部署策略部分
⬇︎ 下载 PNG 𝕏 分享到 X
GPT-5.5 (xhigh) 和 Claude Opus 4.7 的运行成本分别高达 $3,357 和 $5,117，表明三大AI厂商正同步推高模型定价天花板。
— 行业对比部分
⬇︎ 下载 PNG 𝕏 分享到 X

#Gemini#Google#AI模型#API定价#大模型部署

打开原文

2026年5月19日

今天在 Google I/O 大会上，Google 发布了 Gemini 3.5 Flash。这款模型跳过了 -preview 预览阶段，直接面向公众发布，Google 似乎计划将其应用于大量核心产品中：

今天起，数十亿用户均可使用 3.5 Flash：
* 所有用户均可通过 Gemini 应用程序和 Google 搜索中的 AI 模式使用；
* 开发者可通过 Google Antigravity 主导的开发平台、Google AI Studio 和 Android Studio 中的 Gemini API 使用；
* 企业用户可通过 Gemini 企业代理平台和 Gemini 企业版使用。

与以往一样，最有趣的细节隐藏在《Gemini 3.5 Flash 新增功能》开发者文档中。它基本保留了前代 Gemini 3.x 系列的所有平台功能，但不再支持计算机操作。模型 ID 为 gemini-3.5-flash，知识截止日期为 2025 年 1 月，支持最多 1,048,576 个输入标记和 65,536 个最大输出标记。

Google 还推出了新的 Interactions API，目前处于测试阶段。在我看来，这类似于 OpenAI Responses 引入的模式——特别是服务端历史记录管理功能。

#### 价格上调

Gemini 3.5 Flash 的发布伴随着显著的价格上涨。此前“Flash”系列的模型为 Gemini 3 Flash Preview 和 Gemini 3.1 Flash-Lite。新推出的 3.5 Flash 价格是 3 Flash Preview 的 3 倍，是 3.1 Flash-Lite 的 6 倍（详见价格对比）。

按每百万输入标记 $1.50、每百万输出标记 $9 的定价，其价格已接近 Google 的 Gemini 3.1 Pro（$2 输入，$12 输出）。

Gemini 团队承诺，“下个月”将推出 3.5 Pro——预计价格会更高。

这符合一个趋势：OpenAI 的 GPT-5.5 是 GPT-5.4 价格的两倍，而 Claude Opus 4.7 在考虑新分词器后，价格约为 4.6 的 1.46 倍。

考虑到价格的大幅上涨，Google 将其应用于如此多面向消费者的免费产品中，显得尤为引人注目。这似乎表明，三大 AI 实验室正开始试探其 API 客户的价格承受能力。

Artificial Analysis 发布了其专有基准测试在各模型上运行的成本数据，这是一种将分词方式和推理标记数量增加等因素纳入考量的实用方法。以下是一些值得比较的数据：

运行 3.5 Flash（高）基准测试的成本远超 3.1 Pro 预览版！

以下是其他厂商的部分数据：

#### 一只骑自行车的鹈鹕

我向 Gemini API 发出了请求：“生成一张鹈鹕骑自行车的 SVG 图像”（代码见此），得到了以下结果——这可真是“相当”：

图片 1：黑色背景，天空中飞舞着蝙蝠，背景为风格化的月亮。鹈鹕造型奇特，喙部非常出色。自行车架略有扭曲，踏板到后轮的连杆缺失。车灯照亮前方道路，整体风格时尚。

代码注释中写道：

Hedgehog 在 Hacker News 上评论：

这只鹈鹕看起来像是去迈阿密参加加密货币大会的。

这次请求消耗了 11 个输入标记和 14,403 个输出标记，总成本不到 13 美分。