上下文工程 (Context Engineering)：优化 AI Agent 性能的四个挑战和六种技术 - 文章 - 开发者社区

picture.image

写在前面

上下文工程（Context Engineering）是伴随 AI LLM 和智能体发展兴起的一项关键技术，旨在通过精妙管理上下文窗口，解决长上下文导致的性能下降问题，如“上下文腐烂”（Context Rot）。

今天咱们基于近期 Context Engineering Meetup 的分享和相关资料，深入探讨了六大核心技术：RAG、工具选择、上下文隔离、修剪、总结和卸载。这些方法通过优化信息输入、减少冗余和冲突，帮助智能体在复杂任务中更高效、精准地运行。尽管仍处于早期探索阶段，上下文工程已展现出巨大潜力，正逐步成为 AI Agent 的核心。

主要挑战：上下文为什么会“出问题”？

上下文毒化（Context Poisoning）：上下文里混进了错误或幻觉信息，模型可能会反复引用这些错误，导致结果偏离。
上下文干扰（Context Distraction）：上下文太长，模型被历史信息牵着走，忽略了更重要的训练知识或当前任务。
上下文混淆（Context Confusion）：无关的冗余信息让模型觉得必须“用上”所有内容，结果反而降低了回答质量。
上下文冲突（Context Clash）：上下文里包含矛盾的信息，削弱了模型的推理能力。

这些问题在长上下文任务中尤其明显，比如一个智能体需要调用50次工具来完成任务，积累的上下文可能会让模型“晕头转向”。

上下文工程的六大技术

为了解决上面这些问题，上下文工程提出了一些实用的技术，具体包括以下六种方法（每种方法都通过 LangGraph 框架在代码示例中实现）：

RAG

· 是什么：在生成回答前，先从外部知识库检索相关信息，塞进上下文里，帮助模型生成更精准的回答。

· 怎么做：比如用 LangGraph 搭建一个 Agentic RAG，先把文档切成小块，存进向量数据库，然后根据用户问题智能检索相关内容，再交给模型处理。

· 效果：能显著提升回答的针对性，但如果检索结果太长（比如 25k token），可能需要结合其他技术来优化。
工具选择（Tool Loadout）

· 是什么：不是一股脑儿把所有工具的描述都塞进上下文，而是根据任务需要，动态选择最相关的工具。

· 怎么做：用向量数据库存储工具描述，根据用户查询的语义相似性，挑出最合适的几个工具（比如只选5个数学函数工具，而不是整个数学库）。

· 效果：减少上下文混淆，提升工具选择的准确性和效率。
上下文隔离（Context Quarantine）

· 是什么：把不同的任务或子任务交给专门的智能体，每个智能体有自己的上下文窗口，避免信息互相干扰。

· 怎么做：用一个“监督者”智能体把任务分配给专业智能体，比如数学任务给数学智能体，研究任务给研究智能体。

· 效果：隔离上下文能防止冲突和干扰，但需要小心协调多个智能体，以免出现协作问题。
上下文修剪（Context Pruning）

· 是什么：把上下文里无关或不必要的信息直接删掉，只保留最核心的内容。

· 怎么做：用一个小型模型（比如 GPT-4o-mini）分析检索到的文档，剔除无关部分，再把精简的内容交给主模型。

· 效果：显著减少上下文长度（比如从 25k token 降到 11k token），同时保持回答质量。
上下文总结（Context Summarization）

· 是什么：把冗长的上下文信息浓缩成简洁的总结，保留关键信息。

· 怎么做：用小型模型把工具调用或文档内容总结成更短的版本（目标减少50-70%的长度），然后把总结内容传给主模型。

· 效果：适合所有信息都重要但太啰嗦的场景，能大幅压缩上下文，同时保留完整信息。
上下文卸载（Context Offloading）

· 是什么：把不立即需要的上下文信息存到外部（比如文件或数据库），需要时再取回。

· 怎么做：比如智能体在任务开始时把目标写到 todo.md 文件，过程中不断更新，或者用 LangGraph 的存储接口保存跨会话的记忆。

· 效果：既能减轻上下文窗口的压力，又能保留长期信息，适合需要长期记忆的任务。

picture.image

当前进展和未来趋势

上下文工程还是个新兴领域，像是“前 HTML 时代”，还没有统一的理论或标准。但随着越来越多团队（如 Anthropic、ManusAI、Cursor 等）分享经验，一些共同的模式已经浮现。比如：

· 多智能体系统：通过隔离上下文，让每个智能体专注单一任务，减少冲突，但协调多智能体仍是个挑战。

· 缓存上下文：把常用的信息（比如系统提示或工具描述）缓存起来，能降低成本和延迟，但解决不了长上下文的核心问题。

· 总结与检索的结合：RAG 和总结/修剪技术的结合，能显著提升效率，减少“上下文腐烂”的影响。

未来，随着更多实践案例和工具（如 LangGraph）的完善，上下文工程可能会形成更系统化的方法论，帮助智能体在复杂任务中更高效地运转。

总结

上下文工程的核心就是“精打细算”地管理大模型的上下文窗口。通过 RAG、工具选择、隔离、修剪、总结和卸载等技术，可以有效解决上下文过长带来的性能问题。这些方法不仅让模型更聪明，还能降低计算成本、提升用户体验。虽然目前还在早期探索阶段，但这些技术已经展现出巨大的潜力，未来可能成为 AI Agent 的核心。

关于上下文工程，我也在持续整理更多信息，欢迎大家关注这些系列：

上下文工程

Context Engineering 推荐文章：

提示词工程 -> 上下文工程，顶级 AI 团队优质文章一次读完，掌握如何通过精准信息管理打造更可靠、更高效的 AI Agent！

原文 - Context Engineering Meetup

https://docs.google.com/presentation/d/16aaXLu40GugY-kOpqDU4e-S0hD1FmHcNyF0rRRnb1OU/edit?usp=sharing