作者|沙丘智库研究团队
来源|沙丘社区(www.shaqiu.cn)
2025年,被市场普遍认为是“智能体元年”,AI Agent的市场热度持续走高,呈现快速发展的趋势。沙丘智库观察到AI Agent的技术路径正在走向统一、通用型AI Agent的雏形已经出现、企业级AI Agent应用价值在部分场景也已初步被验证。
但AI Agent技术仍然不够成熟,与企业期待中的AI Agent相比,当前的AI Agent在完成任务的广度和能力的深度方面都存在局限性。同时,沙丘智库观察到,从2024年下半年开始,很多技术供应商开始使用“AI Agent”一词来描述广泛的产品功能,“滥用”的Agent概念导致市场认知混乱。
为了帮助企业了解AI Agent技术的“理想与现实”,从而更好地管理期望并避免投资失败。沙丘智库发布《Agent技术应用与关键问题研究报告》,报告中回答了关于AI Agent的如下16个关键问题,旨在帮助企业了解AI Agent技术当前的成熟度、应用风险和局限性。
报告目录
Q1:AI Agent是什么?
Q2:AI Agent和Agentic AI的区别是什么?
Q3:AI Agent和AI助手的区别是什么?
Q4:AI Agent一定需要大模型么?
Q5:AI Agent当前存在哪些局限性?
Q6:如何提高AI Agent的可靠性?
Q7:AI Agent带来了哪些新的风险?
Q8:AI Agent包括哪些关键组成部分?
Q9:如何正确设计AI Agent的架构?
Q10:AI Agent适用于哪些应用场景?
Q11:如何快速搭建AI Agent应用?
Q12:企业如何试点AI Agent?
Q13:AI Agent市场有哪些典型供应商?
Q14:AI Agent的发展趋势是什么?
Q15:如何实现从单Agent到多Agent?
Q16:企业如何应对AI Agent的未来?
完整报告:沙丘智库《Agent技术应用与关键问题研究报告》(28页PPT)
以下内容节选自沙丘智库《AI Agent技术应用与关键问题研究报告》
▎Q:AI Agent一定需要大模型么?
在大模型出现以前就已经有AI Agent。AI Agent可以利用任何类型的AI技术,包括基于规则的系统、强化学习、深度学习、知识图谱等。因此,伴随着人工智能技术的迭代,AI Agent也经历了多个发展阶段,包括符号Agent、反应Agent、基于强化学习的Agent、具有迁移学习和元学习的Agent等。
随着大模型技术的成熟,企业对AI Agent的关注来自于将LLM作为AI Agent的大脑或控制器的核心组成部分,这使得AI Agent在感知和行动执行方面实现巨大突破。但基于LLM的AI Agent同样继承了LLM的所有局限性,尤其是在复杂决策方面存在明显的局限性。
▎Q:如何提高AI Agent的可靠性?
可靠性是当前AI Agent应用的核心挑战。AI Agent可能具备执行某些任务的能力,但不一定能够以足够稳定和可靠的方式满足特定使用场景的要求。例如,Coding Agent可能能够找到并修复代码中的错误,但也可能会引入新的错误。
鉴于当前AI Agent的可靠性不足,人类的监督和干预必不可少。AI Agent在其环境中采取的一系列迭代行动后,需要将结果提交给人类进行审查。例如,Coding Agent可能会在测试环境中执行测试、收集反馈,并对解决方案进行迭代改进,然后将改进后的结果提交给人类进行最终审查。
除了人类的监督外,其他管理AI Agent可靠性的方式包括:
· 选择对可靠性要求不高的场景:在某些情况下,可以选择那些对可靠性要求不是特别高的任务来应用AI Agent。这样即使AI Agent出现一些小的失误,也不会对整体目标产生重大影响;
· 明确且有限的使用范围:为AI Agent定义一个清晰且有限的职责范围,可以减少其需要处理的复杂性和不确定性,从而提高其在该范围内的可靠性;
· 定义测试用例并进行广泛的测试和评估:通过定义详细的测试用例,对AI Agent进行全面的测试和评估,可以发现潜在问题并加以改进。这有助于在实际应用之前,尽可能地提高AI Agent的可靠性和稳定性;
· 设置防护栏和可观测性:设置防护栏可以限制AI Agent的行为范围,防止其做出超出预期或不安全的操作。同时,通过建立可观测性机制,可以实时监控AI Agent的运行状态,及时发现并处理问题;
· 从小规模试点开始,收集反馈并迭代:先进行小规模的试点应用,收集用户和操作人员的反馈,根据反馈不断对AI Agent进行迭代优化。在经过多次迭代并确保AI Agent的可靠性达到一定水平后,再考虑进行更大规模的推广和应用。
▎Q:AI Agent适用于哪些应用场景?
AI Agent并不是万能的解决方案,大多数场景不需要AI Agent。根据场景的复杂性,AI Agent的应用可以分为三类:
第一类:无需使用AI Agent的场景。这类场景的复杂性较低,只需要固定的步骤,不需要动态规划。对于这类场景,使用AI Agent可能是一种资源浪费,更适合使用成熟的技术,例如流程自动化、软件工程甚至线性的LLM调用。
第二类:AI Agent的理想场景。这类场景的复杂度适中,且任务/环境是动态的,需要AI Agent动态规划能力。在这类场景中,即使AI Agent在执行过程中出现了一些错误,也不会对整体结果产生太大的负面影响。
第三类:AI Agent尚未准备好的场景。这类场景的复杂性和风险较高,目前的AI Agent技术成熟度还无法提供足够的可靠性和稳定性。
*更多生成式AI研究可前往“沙丘智库”小程序查阅
*有任何需求可咨询客服微信:zimu738

