谷歌在 I/O 2026 大会上正式发布 Gemini 3.5 Flash 模型。

谷歌 CEO Sundar Pichai 在主题演讲中表示,3.5 Flash 比 3.1 Pro 更强,达到了前沿旗舰模型 90% 的性能,速度快 4 倍。

性能基准测试
Gemini 3.5 Flash 在多项基准测试中表现突出:
- Terminal-Bench 2.1(Agent 终端编码):76.2%,接近 GPT-5.5 的 78.2%,高于 Gemini 3.1 Pro 的 70.3%
- MCP Atlas(多步骤工作流):83.6%,全场最高
- CharXiv Reasoning(多模态理解):84.2%,全场最高
- MMMU-Pro(多模态准确率):83.6%,全场最高
在 Artificial Analysis 坐标系中,Gemini 3.5 Flash 位于右上角(又快又聪明),输出速度超过 280 token/秒,是 GPT-5.5 和 Claude Opus 4.7 的四倍。

在 SWE-Bench Pro 中,Gemini 3.5 Flash 得分 55.1%,低于 GPT-5.5 的 58.6% 和 Claude Opus 4.7 的 64.3%。但作为 Flash 级别小参数模型,速度快 4 倍、价格便宜 3-5 倍,差距在可接受范围内。
在 GDPval-AA(Elo 评分)中,Gemini 3.5 Flash 获得 1656 分,高于 Gemini 3 Flash(1204 分)和 Gemini 3.1 Pro(1314 分),接近 Claude Opus 4.7(1753 分)和 GPT-5.5(1769 分),约为前沿旗舰的 90%。
定价对比
Gemini 3.5 Flash 的 API 定价较上一代 3 Flash 有所上调,但横向对比仍是同级别中最具性价比的选择:
| 模型 | 输入价格(美元/百万 token) | 输出价格(美元/百万 token) |
|---|---|---|
| Gemini 3.5 Flash | 1.5 | 9 |
| Claude Sonnet 4.6 | 3 | 15 |
| Claude Opus 4.7 | 5 | 25 |
| GPT-5.5 | 5 | 30 |
Sundar Pichai 表示,谷歌企业客户每天消耗一万亿 token,若将 80% 负载切换到 Flash 模型,一年可节省超过 10 亿美元。

生态与发布动态
与 Gemini 3.5 Flash 同步发布的还有多项产品更新:
- Gemini Spark:基于 Gemini 3.5 Flash 的 24 小时 AI Agent,下周面向 AI Ultra 订阅用户开放测试
- Gemini Omni Flash:Omni 系列首个模型,支持从文字、图片、音频、视频直接生成视频
- Antigravity 2.0:谷歌 AI 编程平台升级,支持多子 Agent 协作完成任务
Gemini 3.5 Flash 现已在 Gemini App、谷歌搜索 AI Mode、AI Studio 同步上线。
Gemini 3.5 Pro 仍在内部测试中,预计下月发布。
市场策略分析
Gemini App 月活用户已突破 9 亿,企业端日处理 token 量达一万亿。
谷歌今年资本支出预算在 1800 亿至 1900 亿美元之间,是 2022 年的六倍。
相较于 OpenAI 和 Anthropic,谷歌的策略清晰:利用 9 亿月活的分发渠道和全球最大云基础设施,以 Flash 价格提供 Pro 级能力,通过规模优势拉开差距。
Gemini 3.5 Flash 以中杯价格提供大杯能力,配合 4 倍输出速度,在当前 AI 模型市场中具有显著的性价比优势。