AI时代窗口

2026-04-19

导读：在全球科技巨头竞相布局 AI 算力自研芯片的浪潮中，Meta 曾试图通过自主研发摆脱对外部算力供应商的依赖，以

在全球科技巨头竞相布局 AI 算力自研芯片的浪潮中，Meta 曾试图通过自主研发摆脱对外部算力供应商的依赖，以掌控 AI 模型训练与推理的核心环节。然而，其接连推进的两代旗舰训练芯片项目均以失败告终，暴露出在半导体领域根深蒂固的短板。在此背景下，Meta 迅速调整战略，全面转向外部采购算力，与谷歌达成深度合作引入 TPU，同时携手英伟达、AMD 构建多元供应商体系，这一转变不仅重塑了自身 AI 基础设施布局，更推动全球 AI 算力产业格局从单一依赖英伟达生态，迈向多厂商竞争的新阶段。

Meta 的 AI 芯片自主战略正遭遇系统性失效。据媒体报道，继 2024 年放弃第二代训练芯片 Iris 之后，该公司于 2026 年 2 月正式终止了其最为先进的 Olympus 项目。Iris 采用 SIMD 架构，尽管硬件设计相对简洁，但存在软件编程复杂度高、AI 模型训练效率偏低的问题。而 Olympus 采用与英伟达类似的 SIMT 架构，由 Meta 在 2025 年 10 月收购的 Rivos 团队主导研发，原本承诺实现 CUDA 代码兼容。不过，高管层最终判定，该项目软件稳定性不足，设计过于复杂难以实现规模化量产，且在与 OpenAI、谷歌的激烈竞争中风险过高。

两款旗舰训练芯片接连折戟，暴露出 Meta 在半导体领域的深层困境：缺乏能够支撑复杂芯片开发的扎实工程团队，也无法保障最终产品的商业可行性。

战略转向谷歌 TPU

自研之路受阻后，Meta 迅速转向外部采购。2026 年 2 月，Meta 与谷歌达成一项为期多年、价值数十亿美元的协议，租用谷歌 TPU 用于研发新一代 AI 模型，并正协商最早于 2027 年直接采购 TPU 部署在自有数据中心。这标志着谷歌 TPU 首次作为英伟达的替代方案进入超大规模数据中心，打破了此前仅能通过谷歌云租赁使用的局限。

仅在 2026 年 2 月，Meta 便接连与英伟达签署协议采购数百万颗 GPU，与 AMD 达成一项五年期、规模达 1000 亿美元的合作以获取 6 吉瓦 MI450 算力，同时引入谷歌 TPU，由此形成三大供应商格局。马克・扎克伯格宣布，计划到 2030 年部署 “数十吉瓦” 算力，2026 年资本支出将达到 1150 亿至 1350 亿美元，这一规模已非单一供应商所能满足。

谷歌 TPU 的竞争优势

谷歌 TPU 的吸引力在于其系统级的性价比。Gemini 3 与 4 模型已在训练环节验证了 TPU 的可行性：95% 至 100% 的训练任务运行在 TPU 之上，英伟达 GPU 仅占 0% 至 5%。第七代 Ironwood 芯片性能较上一代提升 4 倍，专为推理进行优化，支持多达 9216 颗芯片组成的超节点，能效比 GPU 高出 2 至 3 倍。

对 Meta 而言，TPU 不仅实现了算力来源多元化，也带来了成本优化空间。Meta 全球基础设施负责人 Santosh Janardhan 表示：“以我们当前的规模，三种方案（自研、AMD、英伟达）各有其价值”，而 TPU 的加入正完善这一布局。

行业格局重构

Meta 的转向折射出 AI 基础设施行业的范式转变：从单一依赖英伟达 CUDA 生态，转向多供应商竞争格局。谷歌通过 “TPU 即服务” 模式以及与博通等企业的合作，正构建起可与英伟达抗衡的完整产业链。博通首席执行官透露，除谷歌外，公司已拿下第五家 XPU 定制芯片客户，单季度订单规模达 10 亿美元。

参考阅读：

Meta发布第二代AI芯片MTIA v2

谷歌TPU v7，性能硬刚Blackwell，Anthropic狂买100万颗

谷歌TPU大火？别逗了，真正的芯片血战才刚开始

【声明】内容源于网络

AI时代窗口

关于AI Infra的前沿技术、解决方案以及行业案例

内容 91

粉丝 0

AI时代窗口关于AI Infra的前沿技术、解决方案以及行业案例

总阅读35

粉丝0