模型对比

全面比较 Google Gemini 系列模型的能力、价格和技术规格，帮您选择最适合的模型

模型	类型	上下文	输入/1M	输出/1M
Gemini 2.5 Pro	旗舰	1M	$1.25	$10.00
Gemini 2.5 Flash	高效	1M	$0.30	$2.50
Gemini 2.0 Flash	多模态	1M	$0.10	$0.40
Gemini 1.5 Pro	经典	2M	$1.25	$5.00
Gemini 1.5 Flash	经济	1M	$0.075	$0.30
Gemini 1.5 Flash-8B	轻量	1M	$0.0375	$0.15
Gemini 3.1 Pro	最新旗舰	1M	$2.00	$12.00
Gemini 3.1 Flash	最新高效	1M	$0.50	$3.00
Gemini 3.1 Flash-Lite	最新轻量	1M	$0.25	$1.50
Gemini Nano	端侧	32K	免费	免费

选型建议

追求最高质量

选择 Gemini 3.1 Pro 或 2.5 Pro，提供最强的推理和创作能力

平衡性能与成本

选择 Gemini 3.1 Flash 或 2.5 Flash，速度与能力兼顾

成本敏感型项目

选择 Gemini 3.1 Flash-Lite 或 1.5 Flash，极低的 API 费用

超长文档处理

选择 Gemini 1.5 Pro，支持高达 200 万 Token 上下文

端侧部署

选择 Gemini Nano，设备本地运行保护隐私

快速原型验证

选择 Gemini 2.0 Flash，免费额度充足且功能全面

模型详解

模型对比的定位与使用方式

模型对比这一页更适合解决两个问题：它在整个 Google AI 体系中处于什么位置，以及它最适合承担哪一类任务。很多人在接触模型时容易只看名称或代际，但真正决定体验的，往往是它面对复杂任务时的稳定度、多模态支持范围、上下文保持能力和速度表现。

如果你的工作流涉及长文档阅读、复杂分析、代码协作、创意生成或高频接口调用，那么理解模型对比的能力边界会直接影响使用效率。选对模型，往往能减少反复改写提示词、多轮试错和结果波动。

全面比较 Google Gemini 系列模型的能力、价格和技术规格，帮您选择最适合的模型但在真实使用中，是否优先选择它，还要结合调用入口、团队规模、预算限制和目标产出一起判断。对个人用户来说，这会影响产品体验；对开发者和团队来说，这会影响接入顺序与整体流程设计。

阅读单个模型页时，建议把它放回更大的对照关系中去理解。与速度型模型相比它强在哪里，与更轻量的模型相比它牺牲了什么，以及它更适合直接在产品中使用还是通过 API 接入，都是非常值得同时判断的问题。

阅读重点

模型页适合解决“什么时候选它”。
单个模型要放回整个模型体系里比较。
模型能力、接入方式和预算应一起判断。

延伸阅读

模型对比 API 快速入门订阅计划功能特性

继续理解模型对比时可以关注什么

模型对比不只是参数或定位标签，它更像是一种能力分配选择。对某些任务来说，追求上限最重要；对另一些任务来说，稳定响应、调用成本和交互节奏更重要。

如果你准备把当前模型放进长期流程，建议先判断它更适合放在哪个节点，例如最终回答、资料压缩、图文理解、实时互动还是代码协作。这样的理解方式，比单纯记住功能清单更贴近实际使用。

很多用户在比较模型时会忽略输入类型与任务长度的变化。实际上，同一个模型在短问答、长任务、多模态内容和多轮交互下的表现重点并不完全一样，因此最好结合自己的核心任务来回读。

看任务密度

复杂分析和长链路任务更看重推理稳定性与上下文保持能力。

看交互节奏

高频交互和大规模调用通常更适合速度与成本更平衡的路线。

看接入场景

同一模型在产品端、API 端和团队协作中的价值重点并不完全相同。