大数跨境
0
0

从提示词到上下文,解锁工程领域的进阶之旅

从提示词到上下文,解锁工程领域的进阶之旅 沙丘社区
2025-09-23
0
导读:沙丘智库《2025年上下文工程市场指南》

作者|沙丘智库研究团队

来源|沙丘社区(www.shaqiu.cn)

提示词工程的技术门槛极低,适合快速开发和简单的、一次性的交互,但局限性在于无法处理复杂的、动态的上下文。

随着大模型技术的发展,上下文工程的重要性正在提升,而提示词工程的重要性正在相对下降。

大模型应用在执行多步骤任务时,会利用上下文信息来完成任务。然而,这个过程会导致大量信息和工具“噪声”的积累。随着时间的推移,这些积累的信息会超出大模型的上下文窗口限制,从而导致成本增加、延迟增加和性能下降。

通过有效的上下文管理,可以减少信息和噪声的积累,从而提高大模型应用的准确性和成本效率。尤其是在多智能体和复杂交互的环境中。例如,在一个多人对话的场景中,上下文工程可以更好地理解每个人的对话背景和意图,从而生成更准确、更自然的响应。

未来,提示词工程有可能会被上下文工程所吸收,成为其一个组成部分。

01

上下文工程是什么?

上下文工程(Context Engineering)是一种系统性的方法,用于设计、优化和管理提供给大模型的上下文信息,旨在提高输出的准确性、相关性、可靠性并优化成本。通过构建一个能够动态提供知识和约束的全面系统,上下文工程能够支持大模型在复杂多步骤任务中的高效执行,从而提升整体性能。

提示词工程的重点是构建具体的指令(prompt),引导大模型生成期望的输出。而上下文工程不仅关注指令,还关注如何将足够的相关信息精确地填充到大模型的上下文窗口中。

一个有效的上下文工程具有如下特点:

· 全面性:AI Agent需要访问一个全面的上下文池,这些上下文来自与AI Agent操作环境相关的广泛数据源;

· 显著性:从全面的上下文中筛选出最相关和强信号的元素,只将这些元素呈现给模型;

· 连续性:显著的上下文需要在工作流中的任务或步骤之间持续存在,因为每个步骤都可能依赖于前一步的结果;

· 动态性:上下文能够实时适应AI Agent工作流内外的变化。

02

为什么需要上下文工程?

上下文工程可以直接提高AI Agent的可靠性并降低成本,这对于需要长期运行、多轮交互和复杂任务的大模型应用至关重要。

有效的上下文具有如下优势:

第一,提高采用率和投产成功率。有效的上下文工程通过确保大模型应用的可靠性、准确性和相关性,提高了探索性大模型项目和POC项目成功过渡到全面上线的企业级部署的可能性。

第二,增强信任和用户体验。一致且准确的输出,以及强大的性能和对指令的严格遵循,将建立更高的用户信任,从而提升用户体验。

第三,提高运营效率和可扩展性。有效的上下文工程通过优化token消耗和减少延迟,使大模型应用更具成本效率,适合大规模、生产级的部署。

传统的AI Agent主要依赖于预设的指令来执行任务,这种方式在处理简单任务时效果良好,但在复杂任务中可能显得僵化。上下文工程通过提供丰富的上下文信息,使AI Agent能够超越简单的指令跟随,具备反思性、响应性和适应性。对于涉及多次大模型调用和工具使用的长期、复杂任务来说,上下文工程至关重要。

有效的记忆管理能够保持AI Agent的稳定性和一致性,增强个性化和准确性,并帮助AI Agent学习和适应新的任务和环境。

03

上下文工程会带来哪些风险?

尽管上下文窗口不断增加,但向大模型传递过多或不相关的信息,仍然可能导致任务失败。不当的上下文管理也可能会给大模型应用带来如下风险:

· 上下文污染(Context Poisoning):如果上下文中包含了幻觉或错误,就会被模型反复引用和传播,模型可能会基于这些错误信息开发出不切实际的策略或目标。被污染的上下文很难恢复,因为错误信息可能已经深度嵌入到了模型的推理过程中。

· 上下文混淆(Context Confusion):给大模型提供过多的冗余信息,尤其是过多的工具定义,会使大模型难以聚焦到关键内容,导致输出质量低下或使用不相关的工具。当提供超过几个工具时,模型的表现通常会更差,随着工具数量的增加,性能下降会更加明显。即使提供的工具是相关的,但如果描述重叠,也会使模型感到困惑,这种持续积累的降级、不相关或错误的信息会导致上下文腐烂。

· 上下文腐烂(Context Rot):给大模型提供过多或结构不良的输入、干扰信息以及错误信息,会导致大模型输出质量和推理能力随时间逐渐下降。如果管理不当,上下文腐烂会使模型生成不相关、重复或虚构的响应,从而降低可靠性和信任度。

· 上下文冲突(Context Clash):在多轮互动中,如果早期的尝试中存在错误信息,这些信息可能会保留在上下文中,导致后续的推理过程中出现冲突,导致模型陷入“迷失”状态且无法恢复。AI Agent尤其容易受到信息不一致的影响,因为它们需要整合来自不同来源的信息,而这些信息可能在内容或格式上存在较大差异。

· 资源低效:较大的上下文窗口增加了模型的容量,但也增加了token的使用量,导致更高的计算成本和延迟增加。即使有较大的上下文窗口,模型最终也会达到其处理能力的上限。这使得上下文管理成为一个长期持续的挑战,需要不断优化和调整。

· 多智能体脆弱性:在多智能体架构中,任务被分配给多个智能体并行处理。智能体之间缺乏足够的上下文共享,每个智能体只能基于有限的信息做出决策,这将导致子智能体之间出现相互冲突的假设和不一致的输出,使得整个系统在生产环境中变得脆弱且不可靠。

以上内容节选自:沙丘智库《2025年上下文工程市场指南》


更多研究
2025年央国企大模型应用跟踪报告
2025年金融业智能体最佳实践报告

2025年AI Agent应用最佳实践报告

2025年“大模型+数据分析”最佳实践报告

2025年中国银行业大模型应用跟踪报告

2025年中国证券业大模型应用跟踪报告

大模型应用跟踪调研(2025年8月)

...

*更多生成式AI研究可前往“沙丘智库”小程序查阅

*有任何需求可咨询客服微信:zimu738



【声明】内容源于网络
0
0
沙丘社区
数字化研究与服务机构
内容 672
粉丝 0
沙丘社区 数字化研究与服务机构
总阅读471
粉丝0
内容672