Claude Code 上下文快满时,真正该做的是整理工作记忆

发布时间:2026/7/2 13:38:35
Claude Code 上下文快满时,真正该做的是整理工作记忆 正在用 Claude Code 修一个 auth bug 时,最容易出现的场景不是模型突然不会写代码,而是它读过太多东西。起初只是看src/auth,后来又追到 middleware、token refresh、session store、测试用例、CI 日志、旧的错误栈、几次失败改动、几次人工纠正。终端里看起来只是连续对话,模型视角里却是一整个不断膨胀的工作台。Anthropic 对 context window 的定义很直接,它不是模型训练时学到的知识库,而是模型当前生成回复时可以引用的全部文本,更像一次会话的工作记忆。系统提示、消息历史、工具结果、图片、文档、工具定义,以及本轮输出本身,都会占用这个窗口。(Claude Platform Docs)所以,当 Claude Code 提醒上下文接近上限时,这件事不该被理解成「会话快死了」。更准确的理解是,工作台已经堆满了文件、日志、讨论、错误路线和临时结论,Claude Code 需要把旧材料整理成一份摘要,让后面的工作继续往前走。官方文档把 compaction 解释为在上下文窗口接近限制时自动总结会话,旧的 tool output 会先被清理,随后对话被总结,项目根目录的CLAUDE.md和 auto memory 会在压缩后继续从磁盘重新加载,而只写在对话里的临时指令可能会丢失。(