作者|沙丘智库研究团队
来源|沙丘社区(www.shaqiu.cn)
提示词工程的技术门槛极低,适合快速开发和简单的、一次性的交互,但局限性在于无法处理复杂的、动态的上下文。
随着大模型技术的发展,上下文工程的重要性正在提升,而提示词工程的重要性正在相对下降。
大模型应用在执行多步骤任务时,会利用上下文信息来完成任务。然而,这个过程会导致大量信息和工具“噪声”的积累。随着时间的推移,这些积累的信息会超出大模型的上下文窗口限制,从而导致成本增加、延迟增加和性能下降。
通过有效的上下文管理,可以减少信息和噪声的积累,从而提高大模型应用的准确性和成本效率。尤其是在多智能体和复杂交互的环境中。例如,在一个多人对话的场景中,上下文工程可以更好地理解每个人的对话背景和意图,从而生成更准确、更自然的响应。
未来,提示词工程有可能会被上下文工程所吸收,成为其一个组成部分。
01
上下文工程是什么?
上下文工程(Context Engineering)是一种系统性的方法,用于设计、优化和管理提供给大模型的上下文信息,旨在提高输出的准确性、相关性、可靠性并优化成本。通过构建一个能够动态提供知识和约束的全面系统,上下文工程能够支持大模型在复杂多步骤任务中的高效执行,从而提升整体性能。
提示词工程的重点是构建具体的指令(prompt),引导大模型生成期望的输出。而上下文工程不仅关注指令,还关注如何将足够的相关信息精确地填充到大模型的上下文窗口中。
一个有效的上下文工程具有如下特点:
· 全面性:AI Agent需要访问一个全面的上下文池,这些上下文来自与AI Agent操作环境相关的广泛数据源;
· 显著性:从全面的上下文中筛选出最相关和强信号的元素,只将这些元素呈现给模型;
· 连续性:显著的上下文需要在工作流中的任务或步骤之间持续存在,因为每个步骤都可能依赖于前一步的结果;
· 动态性:上下文能够实时适应AI Agent工作流内外的变化。
02
为什么需要上下文工程?
上下文工程可以直接提高AI Agent的可靠性并降低成本,这对于需要长期运行、多轮交互和复杂任务的大模型应用至关重要。
有效的上下文具有如下优势:
第一,提高采用率和投产成功率。有效的上下文工程通过确保大模型应用的可靠性、准确性和相关性,提高了探索性大模型项目和POC项目成功过渡到全面上线的企业级部署的可能性。
第二,增强信任和用户体验。一致且准确的输出,以及强大的性能和对指令的严格遵循,将建立更高的用户信任,从而提升用户体验。
第三,提高运营效率和可扩展性。有效的上下文工程通过优化token消耗和减少延迟,使大模型应用更具成本效率,适合大规模、生产级的部署。
传统的AI Agent主要依赖于预设的指令来执行任务,这种方式在处理简单任务时效果良好,但在复杂任务中可能显得僵化。上下文工程通过提供丰富的上下文信息,使AI Agent能够超越简单的指令跟随,具备反思性、响应性和适应性。对于涉及多次大模型调用和工具使用的长期、复杂任务来说,上下文工程至关重要。
有效的记忆管理能够保持AI Agent的稳定性和一致性,增强个性化和准确性,并帮助AI Agent学习和适应新的任务和环境。
03
上下文工程会带来哪些风险?
尽管上下文窗口不断增加,但向大模型传递过多或不相关的信息,仍然可能导致任务失败。不当的上下文管理也可能会给大模型应用带来如下风险:
· 上下文污染(Context Poisoning):如果上下文中包含了幻觉或错误,就会被模型反复引用和传播,模型可能会基于这些错误信息开发出不切实际的策略或目标。被污染的上下文很难恢复,因为错误信息可能已经深度嵌入到了模型的推理过程中。
· 上下文混淆(Context Confusion):给大模型提供过多的冗余信息,尤其是过多的工具定义,会使大模型难以聚焦到关键内容,导致输出质量低下或使用不相关的工具。当提供超过几个工具时,模型的表现通常会更差,随着工具数量的增加,性能下降会更加明显。即使提供的工具是相关的,但如果描述重叠,也会使模型感到困惑,这种持续积累的降级、不相关或错误的信息会导致上下文腐烂。
· 上下文腐烂(Context Rot):给大模型提供过多或结构不良的输入、干扰信息以及错误信息,会导致大模型输出质量和推理能力随时间逐渐下降。如果管理不当,上下文腐烂会使模型生成不相关、重复或虚构的响应,从而降低可靠性和信任度。
· 上下文冲突(Context Clash):在多轮互动中,如果早期的尝试中存在错误信息,这些信息可能会保留在上下文中,导致后续的推理过程中出现冲突,导致模型陷入“迷失”状态且无法恢复。AI Agent尤其容易受到信息不一致的影响,因为它们需要整合来自不同来源的信息,而这些信息可能在内容或格式上存在较大差异。
· 资源低效:较大的上下文窗口增加了模型的容量,但也增加了token的使用量,导致更高的计算成本和延迟增加。即使有较大的上下文窗口,模型最终也会达到其处理能力的上限。这使得上下文管理成为一个长期持续的挑战,需要不断优化和调整。
· 多智能体脆弱性:在多智能体架构中,任务被分配给多个智能体并行处理。智能体之间缺乏足够的上下文共享,每个智能体只能基于有限的信息做出决策,这将导致子智能体之间出现相互冲突的假设和不一致的输出,使得整个系统在生产环境中变得脆弱且不可靠。
以上内容节选自:沙丘智库《2025年上下文工程市场指南》
*更多生成式AI研究可前往“沙丘智库”小程序查阅
*有任何需求可咨询客服微信:zimu738

