嗨,我是隔壁公司的某学姐🫶🏻。同是天涯打工人,让我们互相抱团取暖,聊聊工作、学习和生活!欢迎大家文末留言或私信!
“ 现如今ChatGPT的热度逐渐褪去,而字节的扣子逐渐被越来越多的国人知晓,钉钉、百度、Dify等也纷纷涉足工作流功能,打开国内AI工作流to B市场。今天学姐将用通俗易懂的方式讲解AI Agent是什么,以及国内大厂做Agent的进展。大家不要走开哦~🫶”

01
—
AI Agent小科普
-
第一步:先使用搜索引擎搜索一些相关书籍和信息进行阅读,为我们打开思路 -
第二步:形成本书的大纲,并且考虑清楚每一章节要编写的内容 -
第三步:针对每一个章节进行内容的编写,在编写过程中可能会调整文章的大纲 -
第四步:在编写后面章节的时候可能会忘记前面写的内容,需要去翻阅前面已经写的内容 -
第五步:文章初步完成之后,我们可能会找相关专业人士帮忙修改 -
最后:经过几番调整之后,书籍最终成型
-
没有办法使用Google获取最新的外部信息(大模型的训练数据是有日期限制的) -
没有对整个事情进行规划(比如先写大纲,再编写每个章节,然后和别人讨论,最后成文) -
大模型没有记忆的能力,由于上下文(脑容量)的限制,无法一次性完成20万字的文章,会造成前言不搭后语的现象
OpenAl的 Lilian Weng 将以LLM为驱动的 AI Agent,形式化为如下的公式:AI Agent=LLM(大模型)+Planning(规划)+Memory(记忆)+Tools(工具)

也就是说,AI Agent由如下几部分组成,我用一个管理花园的园丁的例子来说明每个模块的作用,希望大伙儿不会觉得枯燥晦涩~
1.LLM(大模型):就像园丁的智慧和知识库,它阅读了海量的园艺书籍和资料,不仅知道各种植物的名字,还懂得如何照顾它们。在AI Agent中,LLM提供了庞大的信息存储和处理能力,以理解和响应我们提出的各种问题。
2.Planning(规划):园丁需要规划整个花园的布局。AI Agent的规划功能,就像园丁制定种植计划,决定先种哪些花草、后种哪些蔬菜,或者如何分步骤修剪树冠。
3.Memory(记忆):这类似于园丁的笔记本,记录了每个植物的种植时间、生长情况和前一次施肥的时间。记忆模块让AI Agent能记住以往的经验和已经完成的任务,确保不会重复错误。
4.Tools(工具):就是园丁的用具,比如铲子、水壶和剪刀。AI Agent的工具模块,指的是它可以运用的各种软件和程序,帮助它执行复杂的任务,就像园丁用工具进行园艺活动一样。
我们也可以认为LLM+Planning+Memory是人类的大脑,而Tools则是人类的四肢。在大模型出现之前,Planning和Memory已经有比较成熟的技术。大模型的出现则补足了AI Agent发展的最后一环。
目前大模型的产品类型,主要有两种:
Copilot:翻译成副驾驶,助手。在帮助用户解决问题时起辅助作用,例如github copilot是帮助程序员编程的助手。
Agent:更像一个主驾驶,智能体,可以根据任务目标进行自主思考和行动,具有更强的独立性和执行复杂任务的能力。
1.核心功能
-
Copilot:更像是一个辅助驾驶员,更多地依赖于人类的指导和提示来完成任务。Copilot在处理任务时,通常是在人为设定的范围内操作,比如基于特定的提示生成答案。它的功能很大程度上局限于在给定框架内工作。 -
Agent:像一个初级的主驾驶,具有更高的自主性和决策能力。能够根据目标自主规划整个处理流程,并根据外部反馈进行自我迭代和调整。
-
Copilot:在处理流程方面,Copilot往往依赖于Human确定的流程,这个流程是静态的。它的参与更多是在局部环节,而不是整个流程的设计和执行。 -
Agent:Agent解决问题的流程是由AI自主确定的,这个流程是动态的。它不仅可以自行规划任务的各个步骤,还能够根据执行过程中的反馈动态调整流程。
-
Copilot:主要用于处理一些简单的、特定的任务,更多是作为一个工具或者助手存在,需要人类的引导和监督。 -
Agent:能够处理复杂的、大型的任务,并在LLM薄弱的阶段使用工具或者API等进行增强。
-
Copilot:主要依赖于LLM的性能,Copilot的开发重点在于Prompt Engineering。 -
Agent:同样依赖于LLM的性能,但Agent的开发重点在于Flow Engineering,也就是在假定LLM足够强 大的基础上,把外围的流程和框架系统化,坐等一个强劲的LLM核心。
02
—
学姐前不久参加了百度的AI开发者大会,虽然整体体验一般,但不难看出百度在AI领域的积累和沉淀。不过,我也发现百度各产品之间的相似性较高,玩法也颇为相似。当然,这只是我的个人观感,百度在AI领域的实力还是不容小觑的。

