大数跨境
0
0

英伟达危!谷歌联手Meta要让TPU支持PyTorch,击穿CUDA护城河

英伟达危!谷歌联手Meta要让TPU支持PyTorch,击穿CUDA护城河 新智元
2025-12-18
1

新智元报道

编辑:艾伦

【新智元导读】

谷歌正推进代号「TorchTPU」的战略行动,旨在让全球主流AI框架PyTorch在谷歌自研TPU芯片上实现高效、无缝运行。此举不仅是技术补课,更意在联合PyTorch掌控方Meta,共同挑战英伟达在AI算力领域的软硬件双重垄断。对谷歌而言,降低开发者迁移门槛,比单纯销售芯片更具战略意义。

谷歌正通过「TorchTPU」计划,系统性提升TPU对PyTorch的支持能力,以打破英伟达GPU在AI训练与推理市场的长期主导地位。

PyTorch是当前全球最广泛采用的AI开发框架,而其生态深度绑定英伟达CUDA——这正是英伟达构筑护城河的核心优势。相较之下,谷歌长期依赖内部框架JAX和XLA优化TPU性能,导致外部开发者适配成本高、迁移意愿低。

「TorchTPU」的核心目标,正是拆除这一软件壁垒,使习惯PyTorch的客户能“无痛”迁移到TPU平台。知情人士透露,谷歌正考虑开源部分相关工具,并投入前所未有的组织资源推动适配。

从自用到外售:TPU的角色演变

TPU早年仅限谷歌内部使用;2022年起,谷歌云获得对外销售主导权,并持续扩大产能与分配额度,以响应企业级AI算力需求激增的市场趋势。

但供需错位明显:开发者普遍使用PyTorch,而TPU原生最优支持框架为JAX。若强行切换,需大量工程重构,在快节奏AI竞赛中难以承受。若「TorchTPU」落地成功,将显著降低企业替代英伟达GPU的转换成本。

盟友Meta:敌人的敌人就是朋友

为加速进展,谷歌正与PyTorch开发者Meta深化合作。双方正探讨协议,扩大Meta对TPU的直接使用权——此前已通过托管服务形式支持Meta运行其模型。

对Meta而言,推动PyTorch与TPU深度适配,既可降低AI推理成本,又能构建硬件供应多元化,削弱对英伟达的依赖,增强供应链谈判筹码。

谷歌已启动TPU直售至客户数据中心的新模式,并于本月任命资深高管Amin Vahdat为AI基础设施负责人,直接向CEO桑达尔·皮查伊汇报,凸显该战略的顶层优先级。

该基础设施不仅支撑Gemini、AI搜索等谷歌核心产品,也服务于Anthropic等依赖谷歌云TPU的外部AI企业。

【声明】内容源于网络
0
0
新智元
智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
内容 14611
粉丝 0
新智元 智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
总阅读77.1k
粉丝0
内容14.6k