百 AI 实战百科

上下文窗口（Context Window）

AI基础 · AI基础

一句话：AI一次能"记住"和处理的文字总量上限，超过这个长度，早期的对话内容会被截断或遗忘。

它是什么

每个AI模型都有一个上下文窗口大小限制（用token数衡量，不同模型从几千到几十万token不等），这个窗口包含了当前对话的所有历史消息加上新的问题。对话/文档太长超出这个限制，模型就没法"看到"最早的内容，可能出现"忘记之前说过的话"的情况。

适合干什么

长文档分析、长对话场景需要了解模型限制
选择AI模型/工具时评估是否满足长文本处理需求

不适合干什么

简单短对话场景（用不上考虑上下文窗口限制这个问题）

普通人怎么用

如果发现AI"忘记"了对话早期提到的内容，很可能是超出了上下文窗口限制；处理长文档时，如果文档特别长，考虑分段处理或者使用支持更大上下文窗口的模型。

进阶用户怎么用

长对话应用可以做上下文管理（比如自动总结早期对话、只保留最相关的历史片段）而不是无脑把所有历史都塞进去；处理超长文档时结合RAG技术只检索相关片段，而不是试图把整个文档塞进一次对话。

常见误区

以为上下文窗口越大越好，实际上下文越长，AI在超长内容里定位关键信息的能力可能下降（"大海捞针"问题），并不是无限大就无限好
以为所有AI工具的上下文窗口一样大，实际不同模型/产品差异很大，处理长文档前要确认清楚

和相似工具的区别

和RAG的关系：当内容长度超出上下文窗口限制时，RAG通过"先检索最相关片段再处理"的方式变相突破了这个限制，两者是解决"AI能处理多少信息"这个问题的不同思路

入门步骤

了解你使用的AI模型的上下文窗口大小
评估你的任务（文档长度、对话轮次）是否会超出限制
超出限制时考虑分段处理或用RAG检索相关片段