亚马逊开发芯片的举措,包括其人工智能芯片 Trainium,是将其高管所说的计算“构建块”——从服务器到云软件——转变为廉价商品的更广泛战略的一部分。
要点:
• 亚马逊的打折举措是其削弱竞争对手的剧本的一部分
• 亚马逊早期的服务器芯片蚕食了英特尔的市场份额
亚马逊的努力凸显了英伟达面临的风险不断上升,因为其最大的客户——亚马逊、谷歌和Microsoft——正在开发自己的人工智能芯片。
长期以来对这种情况发生的担忧促使 Nvidia 支持像 CoreWeave 和 Crusoe 这样的新贵数据中心和云初创公司,并试图通过直接将带有芯片的服务器出租给企业来抢占云市场的份额,以与 Amazon、Google 和 Microsoft 竞争。
英伟达现在直接将由其 AI 芯片驱动的服务器出租给企业,并提供软件帮助他们开发 AI 应用程序,作为该公司表示有朝一日可以产生 1500 亿美元收入的业务的一部分。
最新的折扣表明 AWS 看到了减少对 Nvidia 进行云销售的依赖的机会。AWS 高管在 12 月表示,包括 Apple、Adobe 和 Anthropic 在内的希望替代 Nvidia 的科技公司正在测试最新的 Trainium 芯片,并看到了可喜的结果。另一家主要的云提供商谷歌也将带有自己的 AI 芯片 Tensor Processing Unit 的服务器出租给 Apple 等云客户。
不过,目前尚不清楚 Amazon 将取得多大的成功。
亚马逊列出了租用 Trainium 或 Nvidia 芯片集群的小时费率,但并没有以同类的方式比较这些芯片。去年 12 月,亚马逊声称,Trainium 客户需要支付 H200 芯片(称为图形处理单元)成本的 60% 到 70% 才能实现相同的性能。
目前尚不清楚为什么 AWS 没有宣布为 Trainium 客户提供新的、更便宜的选择,只需支付 H100 芯片(比 H200 弱)成本的 25% 即可产生相同数量的计算能力。
英伟达发言人拒绝置评。AWS 在一份声明中表示:“AWS 是托管 GPU 的最佳场所。我们与 NVIDIA、Intel 和 AMD 等领先的芯片提供商建立了牢固的关系,同时还开发了我们自己的 AWS 设计的芯片,确保我们能够满足客户对生成式 AI 应用程序不断增长的需求。我们的方法是为客户提供最能满足其工作负载需求的计算选择。
经典亚马逊
这种打折举措是经典的亚马逊,多年来,亚马逊通过在网上销售商品的价格上压低竞争对手而蓬勃发展。最近,AWS 告诉云客户,其自主开发的 AI 模型与 Anthropic 等知名开发人员开发的模型一样好,但价格只有三分之一。
如果亚马逊能够将客户支出转移到 Trainium 芯片上,因为 Trainium 芯片的运行成本更低,因为它们需要的功率远低于 Nvidia 芯片,它可以提高其利润率。
但英伟达在 AI 芯片领域的主导地位一直难以动摇,部分原因是其芯片比亚马逊、Microsoft 和 Google 等竞争对手制造的芯片强大得多,还因为软件开发人员习惯于使用芯片设计商专有的 Cuda 编程语言为 Nvidia 芯片编写软件。
示,该公司最近向他们推销租用由 Trainium 芯片提供支持的服务器,这将使他们以 25% 的价格获得与 Nvidia 的 H100 芯片相同的计算能力。Nvidia 的 Hopper 系列芯片一直是 Microsoft、AWS 和 xAI 等大型云提供商和 AI 开发商最抢手的商品之一。
从 Cuda 切换到 Trainium 需要开发人员重写控制 Trainium 功能的软件代码,然后确保 AI 模型能够产生与在 Nvidia 芯片上运行时类似的结果。Trainium 软件也不如 Cuda 成熟。
Anthropic 是开发人员如何犹豫不决接受 Trainium 等 Nvidia 替代品的一个例子。去年秋天,当亚马逊与这家人工智能初创公司谈判提供数十亿美元的新资金时,这家初创公司表示,它更愿意使用由 Nvidia 芯片提供支持的亚马逊服务器。
另一个可能的担忧是,使用 Trainium 可能会使 Anthropic 无法使用 Amazon 服务器,从而在未来更难使用其他云提供商或租用自己的数据中心,因为 Amazon 不会将其硬件提供给其他公司运营的设施。
Anthropic 最终同意使用 Trainium 作为融资交易的一部分。
软件改进
帮助公司使用 AWS 云服务的公司 Caylent 的首席技术官 Randall Hunt 表示,亚马逊现在可能更容易进行推销,因为它最近改进了开发人员与 Trainium 一起使用的编程工具(称为 Neuron),这使其成为 Cuda 的更可行的替代品。他说,这些变化促使一些 Caylent 客户考虑使用 Trainium。
“由于在 Trainium 之上构建的复杂性,以前站不住脚的事情突然变得更加可口,”Hunt 说。
亚马逊可能会采取另一项举措,使其芯片与 Nvidia 的芯片相比更具吸引力。一位 AWS 客户表示,如今,租用 Nvidia 支持的服务器的 AWS 云客户可以选择只购买 Nvidia 芯片产生的部分计算能力,也称为多实例 GPU。
这位人士说,这对 Trainium 来说是不可能的。客户可以根据芯片所支持的应用的需求来调高和调低芯片的性能,但他们仍然必须为整个 Trainium 服务器付费。AWS 客户表示,如果 AWS 切换到更灵活的模式,客户可以租用 Trainium 服务器的一部分容量,这将使其成为比 Nvidia 服务器更具吸引力的选择。
得益于其 Annapurna Labs 芯片设计子公司,Amazon 已成为开发传统服务器芯片并说服客户租用这些芯片的一股力量。近年来,AWS 客户越来越多地使用该公司的 Graviton 服务器芯片,而不是由 Intel 和 Advanced Micro Devices 的芯片提供支持的服务器,因为 Graviton 通常更有价值。
亚马逊开发芯片的举措,包括其人工智能芯片 Trainium,是将其高管所说的计算“构建块”——从服务器到云软件——转变为廉价商品的更广泛战略的一部分。

