
🚀 导语:当大多数人还在关注 AI 模型的"智商"时,Google Cloud 的产品 VP Michael Gerstenhaber 却提出了一个全新视角:AI 模型正在同时挑战三大前沿—— raw intelligence(原始智能)、response time(响应时间)、以及一个常被忽视却至关重要的因素:cost(成本)。这三大维度,正在重新定义 AI 竞赛的规则。
一、从 Anthropic 到 Google:一位 AI 老兵的跨界之旅
Michael Gerstenhaber 的履历堪称 AI 界的"跨界传奇"。
他在 AI 领域深耕约两年,先后在 Anthropic 工作一年半,随后加入 Google。如今,他负责 Google Cloud 的 Vertex AI —— 一个面向企业 AI 开发的统一平台。
"我们的客户主要是工程师,他们想要构建自己的应用,"Gerstenhaber 解释道,"他们想要访问 agentic 模式、agentic 平台,以及世界上最智能模型的推理能力。我提供这些基础设施,但不提供应用本身。"
Shopify、Thomson Reuters 等巨头的 AI 应用,都建立在这个平台之上。
二、Google 的垂直整合优势
是什么吸引了 Gerstenhaber 加入 Google?
答案:垂直整合。
Google 在 AI 领域的布局堪称"全产业链覆盖":
| 层级 | Google 的能力 | 说明 |
|---|---|---|
| 🏭 基础设施 | 数据中心建设、电力采购、发电厂建设 | 掌控最底层资源 |
| 💻 芯片层 | 自研 TPU 芯片 | 硬件自主可控 |
| 🧠 模型层 | Gemini 系列模型 | 自有核心 intelligence |
| ⚡ 推理层 | 完全控制的推理基础设施 | 性能和成本优化 |
| 🤖 Agent 层 | 自主的 agentic 平台 | 智能体能力输出 |
| 🔧 工具层 | 内存 API、代码编写 API | 开发工具链 |
| 🛡️ 治理层 | Agent 引擎确保合规 | 企业级安全保障 |
| 💬 交互层 | Gemini Enterprise & Consumer | 最终用户界面 |
"Google 的独特之处在于,我们从界面层到基础设施层拥有一切,"Gerstenhaber 说,"这种垂直整合是我们的核心优势。"
三、AI 模型的三大前沿:智能、延迟、成本
当被问及 AI 竞赛是否只是"比谁更聪明"时,Gerstenhaber 提出了一个精妙的三分法:
🧠 前沿一:原始智能 (Raw Intelligence)
适用场景:代码生成、复杂推理、科学研究
特点:质量第一,速度第二
"想象一下编写代码,"Gerstenhaber 解释道,"你想要最好的代码,即使它花了 45 分钟也没关系,因为代码需要维护、需要投入生产。"
代表模型:Gemini Pro 等前沿模型
⚡ 前沿二:响应时间 (Latency)
适用场景:客户支持、实时交互、在线服务
特点:在延迟预算内追求最高智能
"如果你在做客户支持,需要知道如何应用政策——能否办理退货?能否升级飞机座位?——但如果你花了 45 分钟才给出答案,再正确也没用。"
关键洞察:一旦用户因为等待而挂断电话,更高的智能就失去了意义。
💰 前沿三:成本可扩展性 (Cost Scalability)
适用场景:大规模内容审核、社交媒体的实时监管
特点:在预算约束下实现最大规模部署
Reddit、Meta 等公司需要审核整个互联网的内容。他们有庞大的预算,但无法承担不确定性风险——今天有多少有害内容?明天呢?
"他们必须将预算限制在能够承受的范围内,选择最高智能但可无限扩展的模型。对于这种情况,成本变得非常重要。"
四、为什么 Agentic AI 普及这么慢?
尽管模型能力突飞猛进,但 AI Agent 的实际应用似乎进展缓慢。为什么?
Gerstenhaber 给出了他的分析:
🚧 基础设施的缺失
"这项技术基本上只有两年历史,还有很多缺失的基础设施。"
| 缺失能力 | 具体问题 | 解决方向 |
|---|---|---|
| 审计能力 | 缺乏审计 Agent 行为的模式 | 可解释性 AI |
| 数据授权 | 缺乏 Agent 数据访问授权模式 | 细粒度权限控制 |
| 生产级模式 | 需要更多生产环境验证模式 | 企业级沙箱 |
🔄 软件工程为何领先?
AI 在软件工程领域的应用明显快于其他行业,原因是什么?
答案是:完善的开发流程
-
✅ Dev 环境:安全的试错空间 -
✅ 测试环境:从开发到生产的桥梁 -
✅ 代码审查:Google 要求两人审计代码 -
✅ 品牌背书:确保产出符合公司标准
"我们有很多人类参与流程,这使得实施风险极低。但我们需要为其他行业和其他职业生产这些模式。"
五、生产环境:技术能力的滞后指标
Gerstenhaber 的一个重要观点是:生产永远是技术能力的滞后指标。
两年时间,对于一项颠覆性技术来说,其实并不长。人们正在努力解决的问题——如何让 Agent 在真实业务场景中安全、可靠地运行——需要时间来完善。
结语:三大前沿的博弈论
Google Cloud 的"三大前沿"理论,为我们理解 AI 竞赛提供了一个全新框架。
这不是一场单一维度的"智商竞赛",而是需要在智能、速度、成本之间找到最佳平衡点的复杂博弈。
对于不同场景,最优解各不相同:
-
科研代码生成 → 优先智能 -
客服实时响应 → 优先延迟 -
社媒内容审核 → 优先成本
真正的赢家,不是在某一个维度上做到极致,而是能够根据场景灵活调配资源、在三大前沿间自由穿行的玩家。
而 Google,正凭借其独特的垂直整合优势,试图成为这个多维度战场的终极赢家。

