

从提示词到上下文，解锁工程领域的进阶之旅

沙丘社区

2025-09-23

导读：沙丘智库《2025年上下文工程市场指南》

作者｜沙丘智库研究团队

来源｜沙丘社区（www.shaqiu.cn）

提示词工程的技术门槛极低，适合快速开发和简单的、一次性的交互，但局限性在于无法处理复杂的、动态的上下文。

随着大模型技术的发展，上下文工程的重要性正在提升，而提示词工程的重要性正在相对下降。

大模型应用在执行多步骤任务时，会利用上下文信息来完成任务。然而，这个过程会导致大量信息和工具“噪声”的积累。随着时间的推移，这些积累的信息会超出大模型的上下文窗口限制，从而导致成本增加、延迟增加和性能下降。

通过有效的上下文管理，可以减少信息和噪声的积累，从而提高大模型应用的准确性和成本效率。尤其是在多智能体和复杂交互的环境中。例如，在一个多人对话的场景中，上下文工程可以更好地理解每个人的对话背景和意图，从而生成更准确、更自然的响应。

未来，提示词工程有可能会被上下文工程所吸收，成为其一个组成部分。

上下文工程是什么？

上下文工程（Context Engineering）是一种系统性的方法，用于设计、优化和管理提供给大模型的上下文信息，旨在提高输出的准确性、相关性、可靠性并优化成本。通过构建一个能够动态提供知识和约束的全面系统，上下文工程能够支持大模型在复杂多步骤任务中的高效执行，从而提升整体性能。

提示词工程的重点是构建具体的指令（prompt），引导大模型生成期望的输出。而上下文工程不仅关注指令，还关注如何将足够的相关信息精确地填充到大模型的上下文窗口中。

一个有效的上下文工程具有如下特点：

· 全面性：AI Agent需要访问一个全面的上下文池，这些上下文来自与AI Agent操作环境相关的广泛数据源；

· 显著性：从全面的上下文中筛选出最相关和强信号的元素，只将这些元素呈现给模型；

· 连续性：显著的上下文需要在工作流中的任务或步骤之间持续存在，因为每个步骤都可能依赖于前一步的结果；

· 动态性：上下文能够实时适应AI Agent工作流内外的变化。

为什么需要上下文工程？

上下文工程可以直接提高AI Agent的可靠性并降低成本，这对于需要长期运行、多轮交互和复杂任务的大模型应用至关重要。

有效的上下文具有如下优势：

第一，提高采用率和投产成功率。有效的上下文工程通过确保大模型应用的可靠性、准确性和相关性，提高了探索性大模型项目和POC项目成功过渡到全面上线的企业级部署的可能性。

第二，增强信任和用户体验。一致且准确的输出，以及强大的性能和对指令的严格遵循，将建立更高的用户信任，从而提升用户体验。

第三，提高运营效率和可扩展性。有效的上下文工程通过优化token消耗和减少延迟，使大模型应用更具成本效率，适合大规模、生产级的部署。

传统的AI Agent主要依赖于预设的指令来执行任务，这种方式在处理简单任务时效果良好，但在复杂任务中可能显得僵化。上下文工程通过提供丰富的上下文信息，使AI Agent能够超越简单的指令跟随，具备反思性、响应性和适应性。对于涉及多次大模型调用和工具使用的长期、复杂任务来说，上下文工程至关重要。

有效的记忆管理能够保持AI Agent的稳定性和一致性，增强个性化和准确性，并帮助AI Agent学习和适应新的任务和环境。

上下文工程会带来哪些风险？

尽管上下文窗口不断增加，但向大模型传递过多或不相关的信息，仍然可能导致任务失败。不当的上下文管理也可能会给大模型应用带来如下风险：

· 上下文污染（Context Poisoning）：如果上下文中包含了幻觉或错误，就会被模型反复引用和传播，模型可能会基于这些错误信息开发出不切实际的策略或目标。被污染的上下文很难恢复，因为错误信息可能已经深度嵌入到了模型的推理过程中。

· 上下文混淆（Context Confusion）：给大模型提供过多的冗余信息，尤其是过多的工具定义，会使大模型难以聚焦到关键内容，导致输出质量低下或使用不相关的工具。当提供超过几个工具时，模型的表现通常会更差，随着工具数量的增加，性能下降会更加明显。即使提供的工具是相关的，但如果描述重叠，也会使模型感到困惑，这种持续积累的降级、不相关或错误的信息会导致上下文腐烂。

· 上下文腐烂（Context Rot）：给大模型提供过多或结构不良的输入、干扰信息以及错误信息，会导致大模型输出质量和推理能力随时间逐渐下降。如果管理不当，上下文腐烂会使模型生成不相关、重复或虚构的响应，从而降低可靠性和信任度。

· 上下文冲突（Context Clash）：在多轮互动中，如果早期的尝试中存在错误信息，这些信息可能会保留在上下文中，导致后续的推理过程中出现冲突，导致模型陷入“迷失”状态且无法恢复。AI Agent尤其容易受到信息不一致的影响，因为它们需要整合来自不同来源的信息，而这些信息可能在内容或格式上存在较大差异。

· 资源低效：较大的上下文窗口增加了模型的容量，但也增加了token的使用量，导致更高的计算成本和延迟增加。即使有较大的上下文窗口，模型最终也会达到其处理能力的上限。这使得上下文管理成为一个长期持续的挑战，需要不断优化和调整。

· 多智能体脆弱性：在多智能体架构中，任务被分配给多个智能体并行处理。智能体之间缺乏足够的上下文共享，每个智能体只能基于有限的信息做出决策，这将导致子智能体之间出现相互冲突的假设和不一致的输出，使得整个系统在生产环境中变得脆弱且不可靠。

以上内容节选自：沙丘智库《2025年上下文工程市场指南》

▎更多研究

2025年央国企大模型应用跟踪报告

2025年金融业智能体最佳实践报告

2025年AI Agent应用最佳实践报告

2025年“大模型+数据分析”最佳实践报告

2025年中国银行业大模型应用跟踪报告

2025年中国证券业大模型应用跟踪报告

大模型应用跟踪调研（2025年8月）

...