
从2023年年底,甲子光年智库关注到AI Agent领域开始出现一些明显的变化:大量商业属性的项目出现,创业公司成立,而非仅仅是学术层面的关注和讨论;紧接着的2024年3月到4月,更是感受到了AI Agent相关产品的一波发布小高峰。
因此2024年4月底,甲子光年智库发布了《2024年AI Agent行业报告》,尝试去探讨AI Agent行业的变化和潜力。
本篇文章则是对报告的第一部分进行解读及补充。
1.AI Agent不是AI领域的新概念,大模型可以帮助人们更好地实现“广泛和实用”的AI Agent
-
LLM给AI Agent底层提供了一个突破性技术方案:LLM带来了深度学习新范式,思维链和强大的自然语言理解能力有望让Agent 具备强大的学习能力和迁移能力,从而让创建广泛应用且实用的Agent成为可能。
-
LLM的框架优势:过去等强化学习基于深度学习框架可让Agent学到技能,但Agent的泛化性较差,往往用于非常窄的特定领域,例如用在游戏或低维层面的控制或计划,标志性应用是围棋领域的AlphaGo。

2.对于AI Agent来讲,没有大模型是不行的,但是只有大模型也是不行的
没有大模型,当下的AI Agent是无法拥有强大的“智力”水平,大模型提升AI Agent的理解力和泛化能力,使其能更好地处理多种任务和上下文信息。这增强了AI代理的自然语言处理能力,从而提供更个性化、连贯的交互体验。
AI Agent包括【工具】能力、【记忆】能力、【行动】能力、【规划】能力作为主要组件,同时需要用户、外界环境、系统开发人员及其他的Agents进行交互。大模型仅仅代表“内功”能力,最后Agent呈现功能和效果非常依赖产品设计。
3.因此当下的AI Agent可以看作LLM技术下Prompt工程的进化
Agent的核心在于自主性的增强,这种增强的核心要义是可以去独立完成一个工作节点,在某个工作节点几乎可以减少人类的审核。让整个事件的流程在此刻完成闭环——成本降到最低(包括时间成本和金钱成本)。
当下,甲子光年智库认为评价一个Agent的逻辑是看在流程上的节点上完成了什么程度的自动化。
这也意味着AI Agent从一开始就有一个很广泛的产品概念,从应用的角度讲,是更应该关注其产品功能。
4.【记忆】和【规划】能力可能是AI Agent的奢侈品
理解当下,甚至一段时间的AI Agent产品和学术概念都是有明显差别的,但是却并不耽误AI Agent完成相应的商业化进程,部分产品的设计可以去弥补相应的缺憾,甚至可以对AI Agent说“你不需要多完美”。
5.甲子光年智库认为AI Agent市场仍然处于非常早期的阶段
2024是AI Agent的爆发之年,大量的产品、项目还藏在水下,正在进行不断地探索和规划。
同时也是Copilot和Agent概念混乱的一年,由于产品会有相似性,市场中往往也会把自动化程度高的Copilot产品作为泛化的Agent概念产品。Copilot 与Agent的混淆点在于对于“工作流”的“自动化”的区分:从完成效果看,工作可以人为地被无限拆分,部分“Copilot产品+自动化”可以完成单个工作单元的完全自动化。
(注意:chatbot、copilot和agent之间并没有鄙视链关系)
6.Agent的商业价值围绕工作范式差别展开(面向过程VS面向目标),工作范式的改变则意味着真正的智能时代开启
AI Agent不是一蹴而就完成的,往往是通过各种能力的进化逐步实现自动化,参考图L1-L4。
实现这个自动化的过程,也是从【面向过程架构】到【面向目标架构】的过程。
“面向目标架构”(Target-Oriented Architecture)是一个在软件工程和企业架构领域使用的概念,它强调在设计和开发系统时以最终目标或业务成果为导向。换句话说,它是一种以终为始的方法,从预期的业务成果出发,逆向规划所需的技术架构和组件。更能确保技术解决方案与业务战略紧密对接,从而提高整体的业务价值和效率。
以上为报告第一部分的解读,关注公众号「汇智智能体」,后台回复“2024年AI Agent行业报告”,可获得高清版完整PDF。
