大数跨境

Meta 自研 AI 芯片遇挫,转向谷歌 TPU

Meta 自研 AI 芯片遇挫,转向谷歌 TPU AI时代窗口
2026-04-19
5
导读:在全球科技巨头竞相布局 AI 算力自研芯片的浪潮中,Meta 曾试图通过自主研发摆脱对外部算力供应商的依赖,以

在全球科技巨头竞相布局 AI 算力自研芯片的浪潮中,Meta 曾试图通过自主研发摆脱对外部算力供应商的依赖,以掌控 AI 模型训练与推理的核心环节。然而,其接连推进的两代旗舰训练芯片项目均以失败告终,暴露出在半导体领域根深蒂固的短板。在此背景下,Meta 迅速调整战略,全面转向外部采购算力,与谷歌达成深度合作引入 TPU,同时携手英伟达、AMD 构建多元供应商体系,这一转变不仅重塑了自身 AI 基础设施布局,更推动全球 AI 算力产业格局从单一依赖英伟达生态,迈向多厂商竞争的新阶段。

Meta 的 AI 芯片自主战略正遭遇系统性失效。据媒体报道,继 2024 年放弃第二代训练芯片 Iris 之后,该公司于 2026 年 2 月正式终止了其最为先进的 Olympus 项目。Iris 采用 SIMD 架构,尽管硬件设计相对简洁,但存在软件编程复杂度高、AI 模型训练效率偏低的问题。而 Olympus 采用与英伟达类似的 SIMT 架构,由 Meta 在 2025 年 10 月收购的 Rivos 团队主导研发,原本承诺实现 CUDA 代码兼容。不过,高管层最终判定,该项目软件稳定性不足,设计过于复杂难以实现规模化量产,且在与 OpenAI、谷歌的激烈竞争中风险过高。

两款旗舰训练芯片接连折戟,暴露出 Meta 在半导体领域的深层困境:缺乏能够支撑复杂芯片开发的扎实工程团队,也无法保障最终产品的商业可行性

战略转向谷歌 TPU

自研之路受阻后,Meta 迅速转向外部采购。2026 年 2 月,Meta 与谷歌达成一项为期多年、价值数十亿美元的协议,租用谷歌 TPU 用于研发新一代 AI 模型,并正协商最早于 2027 年直接采购 TPU 部署在自有数据中心。这标志着谷歌 TPU 首次作为英伟达的替代方案进入超大规模数据中心,打破了此前仅能通过谷歌云租赁使用的局限。

仅在 2026 年 2 月,Meta 便接连与英伟达签署协议采购数百万颗 GPU,与 AMD 达成一项五年期、规模达 1000 亿美元的合作以获取 6 吉瓦 MI450 算力,同时引入谷歌 TPU,由此形成三大供应商格局。马克・扎克伯格宣布,计划到 2030 年部署 “数十吉瓦” 算力,2026 年资本支出将达到 1150 亿至 1350 亿美元,这一规模已非单一供应商所能满足。

谷歌 TPU 的竞争优势

谷歌 TPU 的吸引力在于其系统级的性价比。Gemini 3 与 4 模型已在训练环节验证了 TPU 的可行性:95% 至 100% 的训练任务运行在 TPU 之上,英伟达 GPU 仅占 0% 至 5%。第七代 Ironwood 芯片性能较上一代提升 4 倍,专为推理进行优化,支持多达 9216 颗芯片组成的超节点,能效比 GPU 高出 2 至 3 倍。

对 Meta 而言,TPU 不仅实现了算力来源多元化,也带来了成本优化空间。Meta 全球基础设施负责人 Santosh Janardhan 表示:“以我们当前的规模,三种方案(自研、AMD、英伟达)各有其价值”,而 TPU 的加入正完善这一布局。

行业格局重构

Meta 的转向折射出 AI 基础设施行业的范式转变:从单一依赖英伟达 CUDA 生态,转向多供应商竞争格局。谷歌通过 “TPU 即服务” 模式以及与博通等企业的合作,正构建起可与英伟达抗衡的完整产业链。博通首席执行官透露,除谷歌外,公司已拿下第五家 XPU 定制芯片客户,单季度订单规模达 10 亿美元。

参考阅读:

Meta发布第二代AI芯片MTIA v2

谷歌TPU v7,性能硬刚Blackwell,Anthropic狂买100万颗

谷歌TPU大火?别逗了,真正的芯片血战才刚开始

【声明】内容源于网络
0
0
AI时代窗口
关于AI Infra的前沿技术、解决方案以及行业案例
内容 91
粉丝 0
AI时代窗口 关于AI Infra的前沿技术、解决方案以及行业案例
总阅读35
粉丝0
内容91