这个系列文章聊一聊 AI Agent 以及 智能体操作系统的概念,以及如何与企业应用结合,打造IT的第二操作系统。
本文介绍:
-
• AI智能体定义 -
• 工作原理 -
• 主要特征 -
• 组成 -
• 推理范式 -
• 种类
定义
AI Agent(AI 智能体/代理) 是一种通过使用可用工具设计工作流程来自主执行任务的系统。
AI 智能体能够解决企业应用中的复杂任务, 包括软件设计、IT 自动化、代码生成和对话辅助。 它们利用大型语言模型 (LLM) 的先进自然语言处理技术, 逐步理解和响应用户输入,并确定何时调用外部工具。
Agent 和 AI Agent
Agent 最基础的概念,指任何能感知环境 并为达成目标而行动的实体,可以 是软件、硬件,甚至是人。比如冰箱自动感知并调节气温,投影仪自动校正等等。 并一定需要 AI 参与。
而AI Agent 则是由AI驱动,不只是遵 循简单规则,能利用机器学习、 自然语言处理等AI技术(目前主要讨论大模型技术)做决策,来实现目标。
后面我们没有详细说明的话,智能体都代指人工智能智能体(AI Agent)。
工作原理
AI 智能体的核心是 大型语言模型 (LLM)。因此,AI Agent通常被称为 LLM 智能体。传统的 LLM 基于用于训练它们的数据生成响应,并且受到知识和推理能力的限制。相比之下,代理技术使用后端工具调用来获取最新信息、优化工作流程并自主创建子任务以实现复杂目标。
这个过程中,自主代理会随着时间的推移学习适应用户的期望。代理能够将过去的交互存储在记忆中并规划未来的行动,从而提供个性化的体验和全面的响应。
AI 智能体的主要特征
人工智能代理的主要特征是推理和行动,但是随着智能体的发展和复杂任务以及场景的需要,更多的特征也被发展起来。
推理
推理能力主要由 LLM 决定, 这一核心认知过程涉及运用逻辑和可用信息得出结论、进行推理并解决问题。具有强大推理能力的人工智能代理可以分析数据、识别模式,并根据证据和上下文做出明智的决策。
行动
根据决策、计划或外部输入采取行动或执行任务的能力,对于人工智能代理与环境互动并实现目标至关重要。这可以包括具身人工智能的物理动作,以及发送消息、更新数据或触发其他进程等数字动作。
观察(感知)
通过感知或传感收集有关环境或情况的信息,对于人工智能代理理解其所处环境并做出明智决策至关重要。这涉及各种形式的感知,例如计算机视觉、自然语言处理或传感器数据分析。
规划
制定战略计划以实现目标是智能行为的关键方面。具备规划能力的人工智能代理能够识别必要的步骤,评估潜在的行动,并根据现有信息和预期结果选择最佳行动方案。这通常涉及预测未来状态并考虑潜在的障碍。
协作
在复杂多变的环境中,与他人(无论是人类还是其他人工智能代理)有效合作以实现共同目标变得越来越重要。协作需要沟通、协调,以及理解和尊重他人观点的能力。
自我完善
自我改进和适应能力是先进人工智能系统的标志。具有自我完善能力的人工智能代理可以从经验中学习,根据反馈调整自身行为,并随着时间的推移不断提升其性能和能力。这可以涉及机器学习技术、优化算法或其他形式的自我修改。
主要组成
简单从使用角度来说,可以参考我之前介绍的 n8n Agent 节点,一个 AI Agent 包含:
-
• 大模型 -
• 工具 -
• 记忆 -
• 决策规划(提示词)
上面的概念我们明白之后,今天看一下稍微详细点儿组成,后期文章会分别下面的内容。
推理范式
构建人工智能代理并没有一个统一的标准架构。解决多步骤问题存在多种范式,常见的有 ReAct 和 ReWOO。
React 范式
借助ReAct 范式,我们可以指示代理在每次采取行动后以及每次工具响应后进行“思考”和规划,以决定下一步使用哪种工具。这些“思考-行动-观察”循环用于逐步解决问题,并迭代改进响应。
ReWOO 范式
与 ReAct 不同,ReWOO 方法消除了对行动规划工具输出的依赖。相反,智能体会提前规划。通过在收到用户的初始提示时预测要使用哪些工具,可以避免工具的重复使用。从以人为本的角度来看,这种方法是可取的,因为用户可以在执行计划之前确认计划。
ReWOO 工作流程由三个模块组成。在规划模块中,代理根据用户的提示预测下一步行动。下一阶段需要收集调用这些工具产生的输出。最后,代理将初始计划与工具输出配对,以制定响应。这种提前规划可以大大减少令牌的使用和计算复杂度,并减少中间工具故障的影响。
智能体种类
简单反射代理
AI 代理可以开发成具有不同能力级别的代理。对于简单的目标,可能更倾向于使用简单的代理,以限制不必要的计算复杂性。按照从最简单到最高级的顺序,主要有 5 种代理类型:
简单反射代理是最简单的代理形式,其动作基于感知。此类代理不具备任何记忆,也不会在信息缺失的情况下与其他代理交互。这类代理基于一组所谓的反射或规则运行。这种行为意味着代理经过预先编程,可在满足特定条件时执行相应的动作。
如果智能体遇到未曾预料的情况,它就无法做出适当的反应。智能体在完全可观察且能够访问所有必要信息的环境中才能有效发挥作用。
基于模型的反射代理
基于模型的反射代理利用其当前的感知和记忆来维护世界的内部模型。随着代理不断接收新信息,模型会进行更新。代理的行为取决于其模型、反射、先前的指令和当前状态。
与简单的反射型智能体不同,这些智能体可以将信息存储在记忆中,并能在部分可观察且不断变化的环境中运作。然而,它们仍然受到自身规则的限制。
基于目标的代理
基于目标的代理拥有一个内部世界模型,以及一个或一组目标。这些代理会搜索能够达成目标的动作序列,并在执行之前规划这些动作。与简单和基于模型的反射代理相比,这种搜索和规划提高了它们的效率。
基于效用的代理
基于效用的代理会选择能够达成目标并最大化效用或奖励的行动序列。效用是通过效用函数计算的。该函数会根据一组固定的标准,为每个场景分配一个效用值,即衡量某个行动的实用性或代理的“满意度”的指标。
标准可以包括目标进展、时间要求或计算复杂度等因素。然后,代理会选择最大化预期效用的行动。因此,当多个场景都能实现预期目标,并且必须选择一个最优场景时,这些代理非常有用。
学习代理
学习型代理拥有与其他类型代理相同的能力,但其独特的学习能力使其更具优势。新的经验会被自动添加到其初始知识库中。这种学习增强了代理在陌生环境中的运作能力。学习型代理的推理方式可能基于效用,也可能基于目标,并由以下四个主要元素组成:
-
• 学习: 这个过程通过环境的规则和传感器来学习,从而提高代理的知识。 -
• 评论员: 此组件向代理提供反馈,说明其响应质量是否符合性能标准。 -
• 性能: 此元素负责选择学习时采取的行动。 -
• 问题生成器: 该模块创建各种要采取的行动建议。
其他代理
随着AI代理的发展,人工智能的复杂性也在不断提高。除了上述主要类型的代理外,还有其他类型的代理,如分层代理、合作代理和知识代理。
分层代理
分层级代理是按层级排列的智能代理的有序集合。高层代理将复杂任务分解成更小的任务,并分配给低层代理。每个代理独立运行,并向其上级代理提交进度报告。高层代理收集结果并协调下级代理,以确保它们共同实现目标。
合作代理
合作型代理是指能够与其他代理合作以实现共同目标的智能体。合作型代理通过合作和沟通来实现目标。这些代理可以是合作型的,也可以是非合作型的。合作型代理可以是团队型的,也可以是个人型的。
知识代理
知识型代理是指能够通过学习和知识获取来增强其能力的智能体。这些代理可以是有记忆的,也可以是无记忆的。有记忆的知识型代理可以通过存储和检索信息来增强其能力。无记忆的知识型代理可以通过分析和推理来增强其能力。
--- END ---

