长期以来, 英伟达公司一直主导着人工智能芯片市场,但客户已经明确表示希望看到更多竞争。事实证明,最强大的替代方案之一可能一直就在我们眼前
十年前, 谷歌发布张量处理单元(Tensor Processing Units),旨在提升公司网络搜索引擎的速度和效率。后来,谷歌将其应用于人工智能应用中的机器学习任务

现在,该公司正在拿下大量 TPU 订单,这表明 TPU 可能成为英伟达 AI 加速器的一个可靠替代方案,用于训练和运行当今复杂的大型语言模型。这些加速器被称为图形处理器(GPU)
两种芯片都能处理训练人工智能模型所需的大量计算,但它们实现的方式却截然不同。英伟达的 GPU 最初是为逼真地渲染视频游戏图像而开发的,通过数千个计算“核心”并行处理多个任务。这种架构也使它们能够以竞争对手技术无法匹敌的速度执行人工智能任务
TPU(线程处理单元)专为一种名为矩阵乘法的 AI 相关工作而设计,矩阵乘法是训练神经网络的主要操作,这些神经网络用于生成 AI 聊天机器人对提示的响应。这类工作大多涉及重复的顺序计算,而非并行计算
TPU 的开发旨在高效地执行这些任务。与 Nvidia GPU 相比,TPU 的适应性较差,功能更专一,但在运行这些操作时,其功耗也更低。Nvidia GPU 则被认为具有更高的适应性和可编程性,但这种灵活性也可能导致其运行成本更高
谷歌于 2013 年开始研发其首款 TPU,并在两年后发布。最初,它被用于提升公司网络搜索引擎的速度和效率。2018 年,谷歌首次将 TPU 部署到其云平台,允许用户注册使用基于相同技术的计算服务,该技术也曾用于提升搜索引擎的速度
这些芯片也经过改造,以支持谷歌内部的人工智能开发。随着谷歌及其 DeepMind 部门开发出诸如 Gemini 等尖端人工智能模型,谷歌能够将人工智能团队的经验反馈给 TPU 芯片设计人员,而后者反过来又能够定制芯片,使其更有利于内部人工智能团队的发展
谷歌最新款 TPU(技术处理单元)Ironwood 于今年 4 月发布。它采用液冷散热,专为运行 AI 推理工作负载而设计——也就是说,直接使用 AI 模型,而不是训练模型。Ironwood 提供两种配置:一种是包含 256 个芯片的小型单元,另一种是包含 9216 个芯片的大型单元
分析师表示,对于某些人工智能任务而言,TPU 的性能可能优于 GPU,因为谷歌可以“剥离芯片中许多与人工智能无关的其他部分”。Goldberg 对英伟达股票给出罕见的“卖出”评级。谷歌的 TPU 产品目前已发展到第七代,谷歌提高芯片的性能,使其更加强大,并降低了运行所需的能耗,从而降低了运行成本
TPU 目前的客户包括 Safe Superintelligence、Salesforce Inc. 和 Midjourney,以及 Anthropic
根据 10 月份公布的一项协议,Anthropic 将通过多达 100 万个 TPU(计算处理单元)获得超过 1 吉瓦的谷歌计算能力。次月,Meta Platforms正在洽谈于 2027 年在其数据中心使用谷歌 TPU
这些进展凸显主要的 AI 公司如何竞相采用 TPU 来增加计算能力,以应对不断增长的需求
最大的 AI 开发商正在花费数百亿美元购买昂贵的英伟达芯片,他们渴望减少对英伟达芯片的依赖,并减轻芯片短缺的影响——这表明 TPU 具有巨大的潜在市场
目前,想要使用谷歌 TPU 的企业必须注册租用谷歌云的计算能力。但这种情况可能很快就会改变。研究分析师表示,收购 Anthropic 的交易更有可能推动谷歌将 TPU 扩展到其他云平台
目前包括谷歌在内的任何公司都没有完全取代英伟达 GPU 的计划;人工智能的发展速度意味着现在还无法实现。尽管谷歌拥有自己的芯片,但它仍然是英伟达最大的客户之一,因为谷歌必须保持对客户的灵活性。如果客户的算法或模型发生变化,GPU 更适合处理更广泛的工作负载
英伟达表示:“英伟达领先业界一代。很高兴看到谷歌取得成功—他们在人工智能领域取得了巨大进步,我们将继续为谷歌提供产品。”
即使是那些签约使用 TPU 的科技公司,仍然大量依赖英伟达芯片。例如,Anthropic 在谷歌与英伟达达成 TPU 合作协议几周后,就宣布一项与英伟达的大交易。谷歌 TPU 最大的希望或许在于,它们最终能够成为推动人工智能发展所需产品组合的一部分
张量芯片——最初是十多年前专为人工智能任务而开发的——如今在英伟达以外的领域也越来越受欢迎,成为训练和运行复杂人工智能模型的一种有效方式。在全球企业担忧过度依赖英伟达之际,张量芯片作为一种替代方案的吸引力与日俱增。要知道,在这个市场中,即使是 AMD 也远远落后于英伟达
图形处理器(GPU)是芯片市场中由英伟达主导的部分,其最初的设计目的是为加速图形渲染——主要用于视频游戏和其他视觉特效应用——但由于其能够处理大量数据和计算,因此也非常适合用于训练人工智能模型。另一方面,TPU 是一种被称为专用集成电路或微芯片的专用产品,其设计用途较为单一

