
过去,AI 像个聪明但被动的秘书,你问一句它答一句;现在,它正变成能独当一面的项目经理,规划、执行、迭代,全程自己搞定——甚至在你睡觉时,它还在继续推进。
每年一度的 Google I/O 开发者大会,今年交出了一份相当有分量的答卷。主角不是新的 Pixel 手机,也不是搜索界面的微调,而是一个叫 Gemini 3.5 Flash 的新模型。Google 对它的定位很明确:这是我们迄今最强的编程和自主智能体模型。换句话说,它不只是来陪你聊天的,它是来替你干活的。
🤖 从"对话"到"动手",AI 的角色正在剧变
如果你过去一两年用过各种 AI 助手,你应该熟悉这样的节奏:你抛出一个问题,AI 快速生成一段看着还挺像样的回答,然后你们就此别过。对话结束,AI 的「工作」也结束了。
Gemini 3.5 Flash 想打破这个循环。它不再满足于陪你闲聊或者帮你写个邮件开头,而是能独立完成一整套编码流程、管理复杂的研究项目,甚至在 Google 内部测试中从零构建出一个完整的操作系统。
注意,这里说的是独立完成——不是你需要一步一步教它怎么做,而是你给出一个目标,它自己拆解任务、写代码、调试错误、整合模块,最后把一个能跑的系统交到你手上。
DeepMind 首席技术官 Koray Kavukcuoglu 在发布前的记者会上说得相当直白:「3.5 Flash 在质量和延迟之间做到了惊人的平衡。」他给出的数据更有冲击力:在编码、智能体任务和多模态推理这些硬核基准测试上,这款新模型几乎全面超越了自家此前的旗舰模型 3.1 Pro。
速度和性能同时提升,这在 AI 圈子里并不常见。通常的做法是模型大了,质量好了,但速度掉了;或者为了做快,只能牺牲精度。Flash 似乎找到了一个甜点。
⚡ 快不是目的,让 AI 真能替你干活才是
如果只是快,那也无非是个更好的聊天机器人。Flash 真正的不同在于它的「智能体」基因。
Google 工程师 Varun Mohan 在 I/O 现场的演示很直观:多个智能体各自负责操作系统的不同模块,有人写内核,有人搞驱动,有人做界面,然后像搭积木一样拼出一个完整可用的系统——整个过程跑在 Google 新推出的 Antigravity 平台上。

Kavukcuoglu 特别提到,Flash 3.5 是和 Antigravity 联合开发的,目的就是给智能体一个「能生活、能工作、能执行」的原生环境。这次大会上发布的 Antigravity 2.0 已经是个独立的桌面应用,完全围绕「智能体优先」的思路重新设计,不再是你在旁边看着 AI 干活,而是 AI 在你的工作空间里自主运转。
听起来像是炫技?其实已经有真刀真枪的案例了。Google 透露,3.5 Flash 的智能体能力已经在一些企业合作伙伴那里落地:银行和金融科技公司在用它自动化原本需要好几周的人工工作流,数据科学团队也在从复杂数据环境里挖掘平时很难发现的深层洞察。
更夸张的是,这个模型能 连续自主运行好几个小时。Google 产品负责人 Tulsee Doshi 补充了一个让人安心的细节:它遇到需要人类判断的决策点或敏感权限问题时,会主动停下来征求你的意见,而不是闷头瞎干。
这种设计思路其实挺聪明——完全放手不放心,每一步都问又烦死人,所以折中方案是:小事自己搞定,大事找你确认。
🧠 Pro + Flash 组合拳,分工明确
Google 还剧透了即将推出的 3.5 Pro 模型。两款模型的定位很清晰,像是一对搭档:
| 模型 | 角色 | 核心优势 | 适用场景 |
|---|---|---|---|
| Gemini 3.5 Pro | 总指挥/编排者 | 深度推理和战略规划 | 复杂项目拆解、关键决策 |
| Gemini 3.5 Flash | 执行者/子智能体 | 极速响应、多线程并行 | 编码实现、工具调用、批量任务 |
Doshi 的解释很接地气:「Pro 是你的大脑,负责想明白要做什么、怎么做;Flash 是你的手脚,负责快速执行、并行推进。」这种分层架构意味着,以后面对复杂任务,你面对的可能不再是一个 AI,而是一个由 Pro 指挥、多个 Flash 协同的小型 AI 团队。
目前,3.5 Flash 已经在 Gemini 应用和 Google 搜索的 AI 模式中默认启用,全球用户都能直接用。I/O 上还有个更重磅的消息:搜索平台本身也要上智能体能力,用户可以直接在搜索里创建、定制和管理自己的专属 AI 智能体。想想看,以后你在搜索框里不只是查资料,而是直接部署一个帮你调研、对比、写报告的小助手,这事儿挺值得期待。
另外还有个面向普通消费者的彩蛋:Gemini Spark。Google 把它定位成一个 7×24 小时运行的个人 AI 智能体,专门帮你打理数字生活的各种琐事——从管理日程到筛选邮件,从提醒你续费到帮你整理旅行计划。听起来有点像科幻电影里的 AI 管家,只不过这次是真的要来了。
⚠️ 能力越大,责任越重
当然,给数以亿计的用户开放这么强的自主 AI 能力,Google 心里也不可能没点数。
去年的一桩悲剧仍然让人心有余悸:一名男子在与 Gemini 持续聊天数周后,精神状况急剧恶化,险些制造大规模伤亡事件并最终自杀,Google 目前正在因此面临诉讼。这件事像一记警钟——当 AI 不再只是回答问题,而是真正「动手做事」、深度介入用户生活时,潜在的风险也在成倍放大。
对此,Google 这次的态度是直面而不是回避。他们表示 Gemini 3.5 系列强化了网络安全和 CBRN(化学、生物、放射、核)防护,并且在处理敏感话题时,模型被调教得更倾向于「审慎回应」而不是简单粗暴地拒绝。这背后是一个更深层的技术思路:不是不让 AI 碰敏感问题,而是教会它怎么安全地碰。
这个方向对不对,还得时间验证。但至少说明,Google 在把 AI 从「玩具」推向「工具」的过程中,已经开始认真考虑那把双刃剑的另一面。
🔮 写在最后
从聊天机器人到能写代码、能搭操作系统、能替你跑项目的 AI 智能体,这一步跨越的不只是技术参数的提升,更是我们对 AI 的根本期待在发生变化。我们不再满足于 AI 是个「更聪明的搜索引擎」,而是希望它成为真正的「数字同事」——能接手那些重复、耗时、需要多步骤配合的任务,让我们把注意力集中在更有创造性的地方。
Google 这次押注很清晰:下一个 AI 浪潮的胜负手,不在谁能聊得更溜、文章写得更华丽,而在谁能 真的帮你把事办了,而且是复杂的事、长时间的事、需要多个步骤协同的事。Gemini 3.5 Flash 加上 Antigravity 这套组合拳,能不能让 Google 在这个赛道抢到先手,接下来几个月的企业合作案例和普通用户反馈会给出最真实的答案。
对于我们这些每天和各种 AI 工具打交道的人来说,一个能连续跑几小时、遇到难题会停下来问你、还能和其他 AI 协同工作的助手,已经比几年前那个只会生成一段漂亮话的聊天框,实实在在地近了一大步。也许用不了多久,「我的 AI 在帮我跑项目」会像「我的电脑在帮我渲染视频」一样,变成一句平平常常的话。
AI 的「 agent 时代」是不是真的要来了?起码从这次 I/O 释放的信号来看,Google 已经 All in 了。

