← AI 百科

上下文窗口(Context Window)

AI基础 · AI基础
一句话:AI一次能"记住"和处理的文字总量上限,超过这个长度,早期的对话内容会被截断或遗忘。

它是什么

每个AI模型都有一个上下文窗口大小限制(用token数衡量,不同模型从几千到几十万token不等),这个窗口包含了当前对话的所有历史消息加上新的问题。对话/文档太长超出这个限制,模型就没法"看到"最早的内容,可能出现"忘记之前说过的话"的情况。

适合干什么

  • 长文档分析、长对话场景需要了解模型限制
  • 选择AI模型/工具时评估是否满足长文本处理需求

不适合干什么

  • 简单短对话场景(用不上考虑上下文窗口限制这个问题)

普通人怎么用

如果发现AI"忘记"了对话早期提到的内容,很可能是超出了上下文窗口限制;处理长文档时,如果文档特别长,考虑分段处理或者使用支持更大上下文窗口的模型。

进阶用户怎么用

长对话应用可以做上下文管理(比如自动总结早期对话、只保留最相关的历史片段)而不是无脑把所有历史都塞进去;处理超长文档时结合RAG技术只检索相关片段,而不是试图把整个文档塞进一次对话。

常见误区

  • 以为上下文窗口越大越好,实际上下文越长,AI在超长内容里定位关键信息的能力可能下降("大海捞针"问题),并不是无限大就无限好
  • 以为所有AI工具的上下文窗口一样大,实际不同模型/产品差异很大,处理长文档前要确认清楚

和相似工具的区别

  • 和RAG的关系:当内容长度超出上下文窗口限制时,RAG通过"先检索最相关片段再处理"的方式变相突破了这个限制,两者是解决"AI能处理多少信息"这个问题的不同思路

入门步骤

  • 了解你使用的AI模型的上下文窗口大小
  • 评估你的任务(文档长度、对话轮次)是否会超出限制
  • 超出限制时考虑分段处理或用RAG检索相关片段