长上下文

支持高达 200 万 Token 的上下文窗口,处理海量信息

技术突破

Gemini 1.5 Pro 支持高达 200 万 Token 的上下文窗口,是当时业界最大的上下文长度之一。 这意味着模型可以一次性处理相当于 900 页 PDF 文档、1 小时视频或大型代码库的内容。

长上下文能力使得 Gemini 可以进行深度文档分析、长视频理解、 大型代码库审查和多轮深度对话,无需对内容进行切分处理。

900 页 PDF

一次性处理整本书籍

1 小时视频

完整视频内容分析

大型代码库

百万行代码审查

海量数据

复杂数据集分析

上下文缓存

Gemini 1.5 Pro 和 Flash 支持上下文缓存(Context Caching)功能。 对于需要反复引用同一大型文档的场景,可以将文档内容缓存起来, 后续查询只需发送新的问题部分,大幅降低 API 调用成本(最高可节省 90%)。

功能详解

长上下文 能解决什么问题

长上下文 更重要的作用,不是告诉你它“听起来很强”,而是帮助你判断它到底适合什么场景、能节省哪些步骤,以及和其他能力之间如何配合。只有把这些问题讲清楚,用户才更容易把当前能力放进真实工作流。

这类页面越具体,越容易帮助你做判断。支持高达 200 万 Token 的上下文窗口,处理海量信息 当页面能把适合的任务、使用边界、典型入口和延伸路径讲明白后,用户就更知道该如何使用它,而不是只停留在概念印象。

阅读功能详情页时,最好同时思考它更适合做前期探索、持续协作、最终输出还是流程自动化。不同能力在同一任务中的位置并不一样,理解这一点之后,很多看似相近的功能差别会更容易看清。

如果你已经知道这项能力有价值,下一步最值得做的是继续查看相关教程和使用入口,把它从“知道存在”推进到“能稳定使用”。

阅读重点

  • 功能页不仅解释是什么,还要解释何时用和怎么配合。
  • 单点能力更适合放进完整任务中理解。
  • 理解能力位置,比只记名称更重要。

把 长上下文 放进工作流时可以怎么想

单项能力往往最适合某一种环节,而不是所有环节都适合。例如有些能力擅长前期探索,有些擅长持续互动,有些擅长结构化整理,有些擅长最终交付。

如果你把 长上下文 放在不合适的位置,可能会感觉效果一般;但一旦放在更契合的任务环节,它的价值往往会非常明显。理解这一点,通常比追求更多功能更重要。

继续阅读时,建议把当前能力与模型页、教程页和具体产品入口结合起来看。这样更容易从能力本身,延伸到真正可用的工作方式。

找准环节

先判断当前能力更适合探索、整理、互动、创作还是执行。

搭配其他能力

单项能力常常需要与模型、教程或产品入口一起使用才更完整。

关注长期可用性

最有价值的能力通常是能反复进入日常任务的能力。