智能系统设计模式系列第七篇-多智能体协作模式：众人拾柴火焰高，多智能体协作的艺术



智能系统设计模式系列第七篇-多智能体协作模式：众人拾柴火焰高，多智能体协作的艺术

AI驱动数字化转型

2025-12-28

导读：如果答案是肯定的，那么多智能体协作模式就很可能为你打开一扇新的大门。它通过引入分工、专业化和协同，将一个庞大而棘手的挑战，转化为一个有序、高效、可管理的流程。

当我们面对一个真正棘手的难题时，单打独斗往往不是最佳选择。想象一下建造一座宏伟的建筑，我们不会期望一位工匠同时精通建筑设计、水电工程、木工和砌砖。恰恰相反，我们会组建一个由建筑师、工程师、电工、水管工组成的专家团队，每个人都在自己的领域里大放异彩，通过紧密协作，最终将蓝图变为现实。

这个道理，在人工智能的世界里同样适用。一个大而全的“万能”智能体，就像那位试图包揽所有活计的工匠，虽然听起来很强大，但在处理那些横跨多个领域、需要不同专业技能的复杂任务时，往往会显得力不从心，甚至捉襟见肘。它的知识边界、工具库和推理能力都构成了无形的天花板，限制了它能达到的高度。

为了打破这层天花板，一种更优雅、更强大的设计哲学应运而生，那就是“多智能体协作模式”。它的核心思想朴素而深刻，那就是“分而治之”。与其构建一个庞大臃肿的单一智能体，不如设计一个由多个小而精的专业智能体组成的“精英团队”。它们各司其职，又彼此连结，共同奏响一曲智能的交响乐。

本章，我们将一同探索这个迷人的设计模式。看看如何将一个宏大的目标拆解成一个个具体的子任务，如何为这些任务匹配最合适的智能体“专家”，以及最重要的，如何让它们之间建立起高效的沟通与协作机制，从而创造出单个智能体无法企及的惊人成果。这不仅仅是技术的堆砌，更是一门关于组织、沟通与协同的艺术。

解构复杂：多智能体协作模式的核心理念

多智能体协作的魅力，始于对复杂问题的精准解剖。一个高级目标，好比一座险峻的山峰，想要直接登顶几乎不可能。我们需要做的，是规划出一条条清晰的路径，将漫长的攀登过程分解成若干个可以衡量和执行的阶段。任务分解，正是这种模式的灵魂。

以一个常见的场景为例，假设我们需要完成一份关于“2025年人工智能技术发展趋势”的深度研究报告。如果把这个任务交给一个单一的通用智能体，它或许能从网上抓取一些信息，然后拼凑成文，但报告的深度和洞察力可能就差强人意了。

但如果我们采用多智能体协作模式，整个流程就变得截然不同。这个任务可以被优雅地分解为：

信息搜集
这个子任务被分配给一个“研究员”智能体。它的“基因”里就刻着对信息检索的精通，它装备了访问学术数据库、行业报告、新闻聚合平台的强大工具，能够快速、准确地搜集海量相关资料。
数据分析
搜集来的原始数据，就像未经雕琢的璞玉。“数据分析师”智能体接手了这些资料，它的专长是处理数字和识别模式。它可能会调用统计分析工具，从看似杂乱无章的数据中提取出关键的增长曲线、技术采纳率和市场预测。
内容生成
最后，分析结果和核心洞见被交到“作家”智能体手中。这位智能体是一位语言大师，它擅长将冰冷的数据和专业的术语，转化为逻辑清晰、引人入胜的文字，最终生成一份高质量的研究报告。

在这个过程中，每个智能体都只做自己最擅长的事。这种分布式的架构带来了显而易见的好处。

首先是模块化。每个智能体都是一个独立的单元，我们可以轻松地对任何一个进行升级、替换或调试，而不会影响到整个系统。想让研究能力更强？那就升级“研究员”智能体，给它接入更专业的数据库工具。

其次是可扩展性。当任务变得更加复杂时，我们可以轻易地增加新的智能体角色。比如，再加入一个“评论员”智能体，专门负责审阅报告的逻辑和事实准确性，或者一个“设计师”智能体，为报告配上精美的图表。

最后是鲁棒性。这就像一艘拥有多个独立防水舱的轮船，远比一个巨大空旷的船舱要安全。即使某个智能体因为工具失效或网络问题暂时“罢工”，整个系统也不会完全崩溃。其他智能体或许可以接管部分工作，或者等待它恢复，系统的整体韧性大大增强。

当这些专业智能体高效协作时，奇妙的化学反应就发生了。它们产生的集体智慧和最终成果，远远超过了任何一个成员单独行动时所能达到的高度。这就是协同的真正力量，1+1的结果，在这里远远大于2。

协作的N种舞姿：智能体如何“团队合作”‍

智能体之间的协作并非只有一种刻板的方式，它们如同一个高水平的舞团，能够根据任务的节拍和旋律，变换出各种优美的“舞姿”。理解这些不同的协作形式，是设计一个高效多智能体系统的关键。

顺序传递的接力赛

这是最直观的一种协作方式。任务像一根接力棒，在一个个智能体之间顺序传递。第一个智能体完成它的部分，将输出结果交给第二个智能体，第二个处理完再交给第三个，以此类推，直到终点。我们前面提到的研究报告生成流程，就是一个典型的例子。研究员搜集信息，然后把信息传递给分析师，分析师再把洞见传递给作家。这种模式结构清晰，易于管理，非常适合那些有明确前后步骤的线性工作流。

并行处理的交响乐

当一个任务可以被拆分成多个互不依赖的子部分时，让智能体们像一个交响乐团一样同时开工，无疑是最高效的选择。想象一下，要分析一个网站的用户体验，我们可以同时派出三个智能体，一个负责分析网站的加载速度，一个负责评估UI设计的美观度，另一个负责检查内容的可读性。它们并行工作，最后将各自的分析报告汇总起来，形成一份全面的评估。这种方式极大地缩短了任务完成时间，充分利用了计算资源。

辩论与共识的圆桌会议

在需要做出复杂决策时，单一的视角往往是有风险的。这时，我们可以组织一场智能体的“圆桌会议”。在这个模式下，不同的智能体被赋予了不同的“性格”或代表不同的利益方。例如，在评估一个投资机会时，可以有一个“乐观派”智能体，专门寻找项目的积极因素和潜在回报；一个“保守派”智能体，专注于识别风险和可能遇到的障碍；还有一个“数据派”智能体，只相信冷冰冰的财务数据。它们通过相互辩论、质询，摆出各自的证据和推理，最终帮助系统得出一个更加周全、平衡的决策。这种模式能够有效避免“群体思维”的陷阱，让决策过程更具深度。

层级分明的指挥链

这种结构模仿了人类世界中的管理体系。一个“管理者”智能体负责接收高级任务，然后将其分解，并将子任务分配给下属的“工作者”智能体。管理者不亲自执行具体任务，它的核心职责是协调、监督和整合结果。例如，一个“软件项目经理”智能体，可以将“开发一个新功能”的大任务，拆解成“编写API”、“设计前端界面”、“编写测试用例”等子任务，然后分别派发给对应的“后端工程师”、“前端设计师”和“测试工程师”智能体。这种层级结构，让复杂任务的管理变得井然有序。

各显神通的专家团

这是对团队协作最形象的模拟。系统汇集了一群拥有不同领域知识的“专家”智能体。当一个复杂的跨领域项目出现时，比如策划一场大型市场营销活动，系统就会激活这个专家团。其中，“市场研究员”负责分析目标受众，“文案策划”负责撰写吸引人的广告语，“图形设计师”（它可能掌握着强大的图像生成工具）负责创造视觉素材，而“社交媒体经理”则负责规划发布日程。它们围绕同一个目标，从各自的专业角度贡献力量，共同完成这个项目。

吹毛求疵的“批评家”‍

质量是生命线。为了确保输出结果的准确性和可靠性，我们可以引入“批评家-审阅者”模式。在这个模式中，一个或一组智能体负责“创造”，比如生成一段代码、起草一份合同或规划一个行动方案。随后，另一组“批评家”智能体登场，它们唯一的任务就是从各个角度对这份初稿进行严格的审查。它们会检查代码是否符合规范、合同是否存在逻辑漏洞、方案是否与组织目标一致、内容是否符合安全和道德准则。在收到“批评家”的反馈后，最初的创造者或其他智能体再对输出进行修改。这个迭代过程极大地提升了最终成果的质量，有效减少了AI常见的“幻觉”或低级错误，在代码生成、研究写作和逻辑检查等严肃场景中，这种模式几乎是不可或缺的。

沟通的桥梁：智能体交互的内在结构

如果说专业分工是多智能体系统的骨架，那么沟通与交互就是它的血脉和神经。智能体之间如何传递信息、如何协调行动，直接决定了整个系统的效率和智慧。它们的相互关系和通信结构，可以从简单到复杂，演变出多种多样的形态。

单枪匹马的独行侠 (Single Agent)

这是最基础的形态，一个智能体独立自主地工作，不与任何其他智能体直接交流。它就像一个在自己工作室里埋头苦干的工匠，虽然能心无旁骛地完成特定任务，但其能力也被自身的知识和工具牢牢地限制住了。

自由连接的社交网络 (Network)

在这个模型中，多个智能体以一种去中心化的方式直接互动，就像一个社交网络中的朋友们。信息可以点对点地自由流动，任务也可以相互委托。这种结构非常灵活，且具有很强的弹性，因为单个智能体的“掉线”不会导致整个网络瘫痪。然而，当网络规模变大时，沟通的成本会急剧上升，如何确保所有成员行动一致、避免混乱，成了一个巨大的挑战。

运筹帷幄的监督者 (Supervisor)

为了解决网络模型的混乱问题，引入一个中心化的“监督者”角色。它就像一个交通指挥塔，负责协调所有下属智能体的活动，分配任务、传递信息、解决冲突。这种层级结构清晰明了，管理起来非常方便。但它的缺点也同样明显，监督者成了一个单点故障，一旦它出现问题，整个系统都可能陷入停滞。同时，如果下属智能体太多或任务太复杂，监督者也可能成为性能瓶颈。

提供支持的“工具人” (Supervisor as a Tool)

这是监督者模式的一个精妙变体。在这里，监督者的角色不再是发号施令的“老板”，而更像一个提供支持和资源的“服务中心”。它可能不直接指挥其他智能体的行动，而是为它们提供强大的工具、关键的数据接口或复杂的计算服务。其他智能体可以根据需要“调用”监督者的能力，来更高效地完成自己的任务。这种方式既利用了监督者的强大能力，又避免了严格的自上而下控制所带来的僵化。

层层递进的金字塔 (Hierarchy)

当任务的复杂性达到一定程度时，单层的监督结构可能就不够用了。金字塔模型将监督者的概念扩展为多层组织结构。高级监督者管理中级监督者，中级监督者再管理基层的工作者智能体。这非常适合那些可以被层层分解的宏大问题，每一层都负责处理相应粒度的子问题。它提供了一种结构化的方式来管理复杂性，实现了决策的分布式进行。

量身定制的特殊编队 (Custom)

这是多智能体系统设计的最高境界，代表了终极的灵活性。它不拘泥于任何一种固定的模式，而是根据具体问题的独特需求，量身打造一套专属的交互和通信架构。这可能是一种混合了多种模式的“四不像”，也可能是一种前所未见的全新设计。要构建这样的定制模型，设计者需要对多智能体系统的原理有深刻的理解，并对通信协议、协调机制和可能涌现的集体行为有精确的考量。这无疑是属于系统架构大师的领域。

选择哪种交互结构，是一个关键的设计决策，需要权衡任务的复杂性、智能体的数量、对自主性的要求、对鲁棒性的需求以及可接受的通信开销等多种因素。

从蓝图到现实：代码中的多智能体世界

理论的探讨终究要落地于实践。幸运的是，如今已有不少优秀的框架能帮助我们轻松构建多智能体系统。接下来，我们将通过具体的代码示例，看看这些协作模式是如何在现实世界中被实现的。

案例一：CrewAI - 打造你的内容创作团队

CrewAI 是一个流行的框架，它以一种非常直观的方式让我们定义智能体、任务以及它们之间的协作流程。下面的Python代码就演示了如何使用CrewAI组建一个“研究员”和“作家”团队，来自动生成关于AI趋势的博客文章。

import os
from dotenv import load_dotenv
from crewai import Agent, Task, Crew, Process
from langchain_google_genai import ChatGoogleGenerativeAI

defsetup_environment():
"""加载环境变量并检查所需的API密钥。"""
    load_dotenv()
ifnot os.getenv("GOOGLE_API_KEY"):
raise ValueError("未找到GOOGLE_API_KEY。请在您的.env文件中设置它。")

defmain():
"""初始化并运行AI团队以使用最新的Gemini模型进行内容创作。"""
    setup_environment()

# 定义要使用的语言模型。
# 为了获得更好的性能和功能，更新为Gemini 2.0系列的型号。
# 对于前沿（预览）功能，您可以使用“gemini-2.5-flash”。
    llm = ChatGoogleGenerativeAI(model="gemini-2.0-flash")

# 定义具有特定角色和目标的Agent
    researcher = Agent(
        role='高级研究分析师',
        goal='查找并总结人工智能的最新趋势。',
        backstory="您是一名经验丰富的研究分析师，具有识别关键趋势和综合信息的能力。",
        verbose=True,
        allow_delegation=False,
    )

    writer = Agent(
        role='技术内容作家',
        goal='根据研究结果撰写清晰且引人入胜的博客文章。',
        backstory="您是一位熟练的作家，可以将复杂的技术主题转化为易于理解的内容。",
        verbose=True,
        allow_delegation=False,
    )

# 为Agent定义任务
    research_task = Task(
        description="研究2024-2025年人工智能的3大新兴趋势。关注实际应用和潜在影响。",
        expected_output="详细总结人工智能的3大趋势，包括要点和来源。",
        agent=researcher,
    )

    writing_task = Task(
        description="写一个基于研究结果的500字博客文章。应该引人入胜且易于普通受众理解。",
        expected_output="关于最新人工智能趋势的完整500字博客文章。",
        agent=writer,
        context=[research_task],  # 关键点：写作任务依赖于研究任务的输出
    )

# 创建Crew
    blog_creation_crew = Crew(
        agents=[researcher, writer],
        tasks=[research_task, writing_task],
        process=Process.sequential,  # 定义了顺序执行的流程
        llm=llm,
        verbose=2# 设置详细的执行日志
    )

# 执行Crew
print("## 正在使用Gemini 2.0 Flash运行博客创作团队... ##")
try:
        result = blog_creation_crew.kickoff()
print("\n------------------\n")
print("## 团队最终输出 ##")
print(result)
except Exception as e:
print(f"\n发生意外错误: {e}")

if __name__ == "__main__":
    main()

在这段代码中，我们可以清晰地看到多智能体协作模式的几个核心要素：

角色定义
Agent类让我们为每个智能体赋予了明确的角色（role）、目标（goal）和背景故事（backstory），这就像是在为一个团队招聘具有特定技能的成员。
任务分配
Task类定义了具体的工作内容，并将其指派给特定的智能体。
协作流程
writing_task中的context=[research_task]这行代码是关键，它明确建立了任务之间的依赖关系，告诉“作家”必须等待“研究员”完成工作后才能开始。Crew中的process=Process.sequential则定义了这是一个“顺序传递的接力赛”模式。
整体编排
Crew对象就像是项目经理，它将智能体和任务组合在一起，并启动（kickoff()）整个工作流程。

案例二：Google ADK - 探索更丰富的协作模式

Google的Agent Development Kit (ADK) 提供了更底层、更灵活的工具，让我们能够构建更多样化的协作结构。

1. 分层结构：指挥官与士兵

下面的代码展示了如何建立一个父子关系的层级结构。一个“协调员”父智能体负责将问候任务委托给“问候者”子智能体，将执行任务委托给“任务执行者”子智能体。

from google.adk.agents import LlmAgent, BaseAgent
# ... (其他导入)

# 自定义一个非LLM行为的Agent
classTaskExecutor(BaseAgent):
    name: str = "TaskExecutor"
    description: str = "执行一个预定义的任务。"
asyncdef_run_async_impl(self, context) -> AsyncGenerator[Event, None]:
yield Event(author=self.name, content="任务成功完成。")

# 定义各个子智能体
greeter = LlmAgent(name="Greeter", model="gemini-2.0-flash-exp", instruction="你是一个友好的问候者。")
task_doer = TaskExecutor()

# 创建父智能体，并通过sub_agents参数建立层级关系
coordinator = LlmAgent(
    name="Coordinator",
    model="gemini-2.0-flash-exp",
    description="一个可以问候用户并执行任务的协调员。",
    instruction="当被要求问候时，委托给Greeter。当被要求执行任务时，委托给TaskExecutor。",
    sub_agents=[greeter, task_doer]
)

# ADK框架会自动建立父子关系
assert greeter.parent_agent == coordinator
assert task_doer.parent_agent == coordinator
print("智能体层级结构创建成功。")

这段代码完美诠释了“层级分明的指挥链”模式。coordinator智能体的指令明确了它的分发逻辑，它像一个调度中心，根据任务类型将工作分派给最合适的下属。

2. 顺序工作流：环环相扣的生产线

ADK的SequentialAgent可以轻松构建线性的多步骤工作流，这与CrewAI的顺序流程异曲同工。

from google.adk.agents import SequentialAgent, Agent

# 步骤1：获取数据，其输出将保存到会话状态的"data"键中
step1 = Agent(name="Step1_Fetch", output_key="data")

# 步骤2：处理数据，它的指令告诉它去哪里找到上一步的数据
step2 = Agent(
    name="Step2_Process",
    instruction="分析在state['data']中找到的信息并提供摘要。"
)

# 用SequentialAgent将步骤串联起来
pipeline = SequentialAgent(
    name="MyPipeline",
    sub_agents=[step1, step2]
)

这个pipeline就是一个微型的生产线。当它运行时，step1首先执行，其结果被自动存入一个共享的“仓库”（session.state），随后step2启动，从“仓库”中取出半成品继续加工。

3. 并行执行：分头行动的侦察兵

当任务可以并发处理时，ParallelAgent就派上了用场。下面的例子中，一个“数据收集器”同时派出了“天气查询器”和“新闻查询器”。

from google.adk.agents import Agent, ParallelAgent

# 定义并行运行的各个智能体
weather_fetcher = Agent(
    name="weather_fetcher",
    model="gemini-2.0-flash-exp",
    instruction="获取给定位置的天气并仅返回天气报告。",
    output_key="weather_data"# 结果存入session.state["weather_data"]
)

news_fetcher = Agent(
    name="news_fetcher",
    model="gemini-2.0-flash-exp",
    instruction="获取给定主题的热门新闻报道并仅返回该报道。",
    output_key="news_data"# 结果存入session.state["news_data"]
)

# 用ParallelAgent来协调它们
data_gatherer = ParallelAgent(
    name="data_gatherer",
    sub_agents=[weather_fetcher, news_fetcher]
)

data_gatherer启动后，weather_fetcher和news_fetcher会同时开始工作，就像派出了两个侦察兵分头行动，极大地提高了信息收集的效率。

4. 智能体即工具：可随时调用的专家

这是一种非常高级且强大的模式。一个智能体可以将另一个功能专一的智能体当作自己的“工具”来调用。

from google.adk.agents import LlmAgent
from google.adk.tools import agent_tool

# ... (定义一个简单的generate_image函数作为核心工具)

# 1. 定义一个专门使用工具的“图像生成”智能体
image_generator_agent = LlmAgent(
    name="ImageGen",
    model="gemini-2.0-flash",
    instruction="你的任务是接收用户的请求，并使用`generate_image`工具来创建图像。",
    tools=[generate_image]
)

# 2. 将这个智能体包装成一个“工具”
image_tool = agent_tool.AgentTool(
    agent=image_generator_agent,
    description="使用此工具生成图像。输入应为所需图像的描述性提示。"
)

# 3. 创建一个更高级的“艺术家”智能体，它拥有上面那个“工具”
artist_agent = LlmAgent(
    name="Artist",
    model="gemini-2.0-flash",
    instruction="你是一个富有创造力的艺术家。首先，为一幅图像构思一个创意提示。然后，使用`ImageGen`工具根据你的提示生成图像。",
    tools=[image_tool]
)

在这个例子中，“艺术家”智能体自身并不具备生成图像的能力。但它知道如何调用image_tool。当它需要一张图片时，它会先构思好创意（它的核心任务），然后将这个创意作为参数传递给image_tool。AgentTool这座桥梁会激活image_generator_agent，后者再调用真正的generate_image函数完成工作。这种模式实现了能力的高度封装和复用，让智能体可以像搭积木一样组合起来，解决更宏大的问题。

设计的权衡：何时召唤“智能体军团”？

我们已经领略了多智能体协作的强大威力与多姿多彩的实现方式。但正如没有包治百病的良药一样，这种模式也并非适用于所有场景。它的优势在于解决那些单凭一己之力难以克服的复杂、多方面问题。

那么，何时才是召唤“智能体军团”的最佳时机呢？一条简单而实用的经验法则是，当你发现一个任务具备以下一个或多个特征时，就应该认真考虑采用多智能体协作模式了：

任务可分解性
问题是否可以被清晰地拆解成多个相对独立的子任务？
技能专业化
这些子任务是否需要截然不同的专业技能、知识库或外部工具？例如，一个任务需要调用数学计算API，另一个需要进行自然语言的创意写作。
并行可能性
多个子任务是否可以同时进行，以提高效率？
多阶段流程
整个工作流程是否包含多个定义明确的阶段，前一阶段的输出是后一阶段的输入？

如果答案是肯定的，那么多智能体协作模式就很可能为你打开一扇新的大门。它通过引入分工、专业化和协同，将一个庞大而棘手的挑战，转化为一个有序、高效、可管理的流程。

这篇文章我们深入探讨了智能体之间的“内部协作”，见证了它们如何组成团队，共同完成目标。然而，智能体并非生活在真空中，它们还需要与广阔的外部世界进行交互。理解了智能体如何“对话”，我们自然会引出下一个更迷人的问题，它们如何感知世界、并与外部环境和工具进行互动？这，将是我们下一章探索的旅程。

文章核心内容来自开源书籍《智能系统设计模式：构建智能系统的实战指南》（作者：Antonio Gulli）

【声明】内容源于网络

AI驱动数字化转型

专注AI，促进智造行业数据衍生，服务智能制造企业的数字化、智能化，聚焦大模型私域部署、大模型微调、数据清洗、AI模型训练、私域知识库及agent技术延展等。行业智能，落地为先。

内容 809

粉丝 0

AI驱动数字化转型专注AI，促进智造行业数据衍生，服务智能制造企业的数字化、智能化，聚焦大模型私域部署、大模型微调、数据清洗、AI模型训练、私域知识库及agent技术延展等。行业智能，落地为先。

总阅读275

粉丝0

内容809