长上下文

支持高达 200 万 Token 的上下文窗口，处理海量信息

技术突破

Gemini 1.5 Pro 支持高达 200 万 Token 的上下文窗口，是当时业界最大的上下文长度之一。这意味着模型可以一次性处理相当于 900 页 PDF 文档、1 小时视频或大型代码库的内容。

长上下文能力使得 Gemini 可以进行深度文档分析、长视频理解、大型代码库审查和多轮深度对话，无需对内容进行切分处理。

900 页 PDF

一次性处理整本书籍

1 小时视频

完整视频内容分析

大型代码库

百万行代码审查

海量数据

复杂数据集分析

上下文缓存

Gemini 1.5 Pro 和 Flash 支持上下文缓存（Context Caching）功能。对于需要反复引用同一大型文档的场景，可以将文档内容缓存起来，后续查询只需发送新的问题部分，大幅降低 API 调用成本（最高可节省 90%）。

功能详解

长上下文能解决什么问题

长上下文更重要的作用，不是告诉你它“听起来很强”，而是帮助你判断它到底适合什么场景、能节省哪些步骤，以及和其他能力之间如何配合。只有把这些问题讲清楚，用户才更容易把当前能力放进真实工作流。

这类页面越具体，越容易帮助你做判断。支持高达 200 万 Token 的上下文窗口，处理海量信息当页面能把适合的任务、使用边界、典型入口和延伸路径讲明白后，用户就更知道该如何使用它，而不是只停留在概念印象。

阅读功能详情页时，最好同时思考它更适合做前期探索、持续协作、最终输出还是流程自动化。不同能力在同一任务中的位置并不一样，理解这一点之后，很多看似相近的功能差别会更容易看清。

如果你已经知道这项能力有价值，下一步最值得做的是继续查看相关教程和使用入口，把它从“知道存在”推进到“能稳定使用”。

阅读重点

功能页不仅解释是什么，还要解释何时用和怎么配合。
单点能力更适合放进完整任务中理解。
理解能力位置，比只记名称更重要。

延伸阅读

功能总览使用教程 API 快速入门订阅计划

把长上下文放进工作流时可以怎么想

单项能力往往最适合某一种环节，而不是所有环节都适合。例如有些能力擅长前期探索，有些擅长持续互动，有些擅长结构化整理，有些擅长最终交付。

如果你把长上下文放在不合适的位置，可能会感觉效果一般；但一旦放在更契合的任务环节，它的价值往往会非常明显。理解这一点，通常比追求更多功能更重要。

继续阅读时，建议把当前能力与模型页、教程页和具体产品入口结合起来看。这样更容易从能力本身，延伸到真正可用的工作方式。

找准环节

先判断当前能力更适合探索、整理、互动、创作还是执行。

搭配其他能力

单项能力常常需要与模型、教程或产品入口一起使用才更完整。

关注长期可用性

最有价值的能力通常是能反复进入日常任务的能力。