大数跨境

Google官宣:别让一个AI单干了!AI Studio上线「Agent团队」,主Agent一声令下,子Agent全线出击

Google官宣:别让一个AI单干了!AI Studio上线「Agent团队」,主Agent一声令下,子Agent全线出击 深空信使
2026-06-09
18
导读:Google官宣:别让一个AI单干了!AI Studio上线「Agent团队」,主Agent一声令下,子Agent全线出击

导读
Google for Developers刚刚在X上甩出一句灵魂拷问:「为什么要让一个AI Agent处理所有事情?你可以组建一支团队。」近8000人围观的这条推文,揭开了Google AI Studio多Agent架构的面纱——一个主Agent作为调度者,拉起多个专业子Agent并行处理复杂任务。与此同时,Google开源的ADK框架、Gemini API的managed agents、Antigravity沙箱环境、Firebase和Maps的工具生态,正在拼成一张完整的Agent基础设施网络。AI应用的竞争,正从「谁的模型更聪明」,转向「谁能组织一群Agent完成真实任务」。

一个AI干所有活?Google说:过时了

6月6日,Google for Developers官方账号在X上发了一条推文,开头就是一个反问:

"Why have one AI agent handle everything when you can build a team?"

「为什么要让一个AI Agent处理所有事情?你可以组建一支团队。」

▲ Google for Developers官方推文,近8000次浏览,111个赞

这句话看似轻描淡写,但仔细品味会发现,Google正在改写AI应用的底层叙事。

过去一年,几乎所有AI产品都在讲同一个故事:打造一个无所不能的超级Agent。一个prompt扔进去,它帮你搜索、写代码、调接口、生成报告、部署上线——全包了。

听起来很美,但现实很骨感。

复杂任务一上强度,单Agent的问题就全暴露了:上下文窗口被撑爆、工具调用顺序一团糟、任务优先级完全混乱,一个环节出错,整条链路全崩。更要命的是——你甚至不知道是哪一步出了问题。

Google显然已经想通了这件事。它的答案是:别让一个Agent硬撑,组建一个Agent团队。

主Agent拉起子Agent:像项目经理一样调度AI

Google官方推文说得很清楚:

"Multi-agent architecture allows a main agent to spin up specialized sub-agents and handle complex tasks in parallel - making workflows faster and more efficient inside Google AI Studio."

「多Agent架构允许一个主Agent拉起专业化的子Agent,并行处理复杂任务——让Google AI Studio中的工作流更快、更高效。」

翻译成大白话就是——AI现在可以像一个项目团队一样运作了。

主Agent的角色类似项目经理:理解用户目标、把大任务拆成小任务、分派给合适的子Agent、最后把结果汇总交付。子Agent则各有专长:

  • Research Agent
    :搜索资料、核验来源、提炼事实
  • Coding Agent
    :生成代码、修改代码、跑测试
  • Data Agent
    :连接数据库、地图、文件等外部数据源
  • QA Agent
    :检查输出质量、找漏洞、跑回归测试

关键在于「并行」两个字。这些子Agent不是排队一个一个干活,而是同时启动、同时执行、互不干扰。理论上,一个需要30分钟的串行任务,拆成5个子任务并行跑,可能只需要6分钟。

科技博主The Future Bits很快捕捉到了这个信号,转发补充道:

▲ The Future Bits转述:主Agent实例化专业子Agent并行处理子任务,而不是把所有事情都塞给一个模型

"Google AI Studio supports multi-agent setups where a primary agent instantiates specialized sub-agents to run subtasks in parallel rather than routing everything through one model."

「Google AI Studio支持多Agent设置:主Agent实例化专业子Agent并行处理子任务,而不是把所有事情都路由给一个模型。」

从「一个模型回答所有问题」到「一组Agent各司其职」——这个转变看似简单,实际上是AI应用范式的根本转向。

ADK早就埋下了伏笔

如果你觉得Google只是发了一条营销推文,那就低估这件事了。

早在Google Cloud NEXT 2025上,Google就发布了开源的Agent Development Kit(ADK),官方博客里白纸黑字写着一个关键词:Multi-Agent by Design(多Agent设计优先)

ADK的文档描述了一套完整的多Agent编排体系:

  • Sequential Agent
    :子Agent按顺序执行,上一个的输出传给下一个
  • Parallel Agent
    :多个子Agent同时启动,并行处理不同任务
  • Loop Agent
    :子Agent循环执行,直到满足特定条件
  • LLM-driven Routing
    :主Agent根据任务内容动态决定把工作交给谁

ADK的Agent Team教程甚至手把手教开发者怎么做:从一个简单的Weather Agent开始,逐步加入不同专业子Agent,设计角色描述,启用自动委派。文档特别强调——Agent的name和description非常重要,因为主Agent要靠这些信息决定把任务交给谁。

换句话说,你给子Agent写的「岗位说明」,直接决定了它会不会被主Agent选中。这和人类团队管理的逻辑如出一辙。

所以Google for Developers这条推文不是突然冒出来的新概念,而是ADK、Gemini API、AI Studio这套工具链的一次集中亮相。Google在用最通俗的方式告诉开发者:多Agent架构已经准备好了,就在AI Studio里,现在就可以用。

AI Studio不只是Playground了

过去提起Google AI Studio,大多数开发者的印象是:拿API key、试模型、调prompt、搭个demo。一个开发者playground,仅此而已。

但现在的AI Studio正在变成另一种东西。

社区用户TestingCatalog观察到,AI Studio里出现了一个名为Antigravity Preview Agent的新选项——描述为「运行在Google托管Linux环境中的通用自主代理」。

▲ TestingCatalog发现AI Studio新增Antigravity Preview Agent,可执行代码、采取真实动作,1.7万次浏览,超300个赞

"A general-purpose autonomous agent running in a remote, Google-hosted Linux environment. This agent can execute code, take real actions, and use a large number of tokens."

「一个运行在远程Google托管Linux环境中的通用自主代理。可以执行代码、采取真实动作、使用大量token。」

执行代码、采取真实动作——这已经不是「playground」了,这是一个真正的Agent执行环境。

与此同时,Gemini API的managed agents更是把这件事推得更远。开发者FHILY在X上感叹:

▲ FHILY:通过一次API调用就能启动生产级AI Agent,2400次浏览

"With Gemini API, developers can now launch production-ready AI agents from a single API call. Secure Linux environments. Persistent memory. Resumable sessions. Scalable workflows."

「通过Gemini API,开发者现在可以通过一次API调用启动生产级AI Agent。安全的Linux环境、持久记忆、可恢复会话、可扩展的工作流。」

一次API调用,启动一个有独立沙箱、有记忆、能恢复会话的Agent。官方文档显示,一个项目最多可以运行1000个managed agents。想象一下这个规模——一千个Agent同时在各自的沙箱里并行工作。

Google的真正野心:一张Agent基础设施网

把视角拉远,你会发现Google做的远不止「给AI Studio加个多Agent功能」这么简单。

它在搭建一整套Agent基础设施:

模型层——Gemini系列。Google Developers India宣布Gemini 3.5 Flash已上线,专为开发者栈设计,更低延迟、更低成本。

▲ Google Developers India:Gemini 3.5 Flash已上线,可通过Enterprise Agent Platform、AI Studio和Antigravity驱动工作流

Agent运行层——managed agents、Antigravity agent、Linux沙箱。Agent不再只是一段prompt,而是有独立运行环境、可执行代码、可管理文件的执行体。

编排层——ADK、workflow agents、routing。Sequential、Parallel、Loop三种模板,加上LLM驱动的动态路由,让开发者可以精确控制Agent之间的协作方式。

工具层——Firebase、Maps、Cloud Run等。Firebase已经宣布与Antigravity和Android Studio集成,支持Agent Skills覆盖移动开发。

▲ Firebase发布说明:与Antigravity、Android Studio集成,Firebase Agent Skills覆盖移动开发,6500次浏览

Google Maps Platform更是直接点出了多Agent架构的一个关键需求——可信数据

▲ Google Maps Platform:用Maps可信数据为LLM推理提供地理空间grounding,1800次浏览

"Building generative AI applications requires more than just logic — it requires real-world context."

「构建生成式AI应用不仅需要逻辑——还需要真实世界的上下文。」

这句话点破了一个事实:多Agent架构的价值,最终要靠工具和数据来兑现。主Agent再聪明,子Agent没有可靠的数据源和执行环境,整个系统就只是空转。而Google恰好拥有搜索、地图、云计算、移动开发工具这些基础设施。

这才是Google的真正护城河——不是某一个模型多强,而是从模型到沙箱到工具到数据到部署的全链路都在自己手里。

多Agent不是魔法,是把难度转移了

说了这么多好处,该泼点冷水了。

多Agent并行确实能提高速度,但也会带来一系列新问题:

成本翻倍:多个Agent同时跑,token消耗、工具调用、沙箱环境的费用都要乘以N。Google说最多支持1000个managed agents——那账单也会很刺激。

子Agent打架:不同子Agent可能给出互相矛盾的结论。主Agent如何仲裁?谁的优先级更高?这些都需要明确的协调机制。

调试噩梦:一个任务失败了,问题出在主Agent的任务拆分?子Agent的执行?还是结果汇总阶段?链路越长,定位越难。

安全边界:能执行代码、浏览网页的Agent需要严格的沙箱隔离和审计机制,否则一个子Agent被注入恶意指令,整个系统都可能沦陷。

换句话说,多Agent架构并没有消除复杂度,它只是把难点从「让一个模型回答得更好」转移到了「如何设计工作流、权限、沙箱和可观测性」。

但这恰恰是软件工程擅长的事情。

从聊天模型到Agent系统:行业拐点已至

开发者Dan Kornas在X上写了一篇长帖,精确捕捉到了这个转变:

▲ Dan Kornas:AI从聊天模型转向Agent系统,Google的Agent栈正在成型

他的核心观察是:2023年大家还在一个模型上调prompt,2025年就已经在通过managed agents系统调用工具和管理操作了。

这个判断和Google此次的动作完全吻合。Google AI Studio推多Agent架构,本质上是在押注一个方向——AI应用的未来不是一个无所不能的超级模型,而是一组分工协作、各有专长的Agent系统。

Anthropic在推Claude Code的coding agent loop,OpenAI在搞Codex和ChatGPT actions,LangGraph和CrewAI在做多Agent工作流编排。但Google这次的不同之处在于:它把多Agent架构直接推到了AI Studio这个更低门槛的开发者入口,而不是藏在Cloud控制台或Python SDK文档里。

这意味着,不会写复杂框架代码的开发者,也可以在AI Studio里拖拽、配置、测试自己的Agent团队。Agent编排的门槛正在急速下降。

AI应用的竞争,已经从「谁的模型跑分高」进入了下一阶段:谁能让一群Agent稳定地、安全地、高效地协作完成真实世界的任务。

Google刚刚亮出了它的底牌。


— END —

— END —

【声明】内容源于网络
深空信使
深空信使
内容 64
粉丝 0
深空信使 深空信使
总阅读344
粉丝0
内容64