英伟达的GPU被客户砍单的传言不是第一次,第三季传过被微软砍单20%,日前再度传出被某大型云端服务供应商CSP(传出仍是微软)砍单,英伟达更下修2024年下半年台积电CoWoS的产能需求。目前供应链对这传言看法偏向保留,倒是认为AMD的MI300杀价竞争会直接冲击英伟达的独占局面。
市场对AMD这种不计短期毛利率和利润,只为冲破英伟达独霸的AI芯片市场,换取部分江山的做法,战术上认可,但仍担心短期资本市场投资人会不买帐。
关于英伟达H100系列GPU被砍单的另一个说法,是微软计划转向采购2024年更新一代的GPU系列B100芯片。英伟达在2014年推出的Blackwell架构B100系列GPU,其性能是Hopper架构的H200两倍以上,将采用台积电3nm制程技术。
放眼全球AI芯片,除了英伟达的GPU,没几个能打的! 全世界都在寻找英伟达GPU的替代品,第一顺位的理想竞争者,也是目前的唯一挑战者AMD推出MI300,直接对标英伟达目前最高性能GPU的H100。
2017年客制化AI ASIC芯片和GPU还有明争暗斗的空间,当年英伟达被Google公开呛:“TPU比当前的GPU和CPU快上15~30倍”,气得黄仁勋提出数据反击TPU,更在当年度推出Tesla V100的GPU,为今日遥遥领先的AI Model Training实力打下厚实基础,之后再推出Ampere架构,从此英伟达在AI Training领域完全没有竞争对手,该领域市占率超过90%。
所有客户都在期待更多英伟达的替代方案,不是英伟达不好,而是不会有客户喜欢单一供应商,无论是价格、供应数量、交期都无法掌握的感觉令人焦虑。尤其是遇上这一次OpenAI带来到ChatGPT热潮,让GPU疯狂大缺货,这情况很像三年前的先进制程foundry缺货,只有台积电能供应,所有客户只能乖乖排队,更衍生出严重的重复下单。
因此,当AMD的MI300问世,英伟达的客户和合作伙伴均来站台力挺并表达支持,包括有微软、甲骨文、Meta、戴尔、惠普、联想、美超微等。不过,有两家科技巨头则是缺席了“AMD Advancing AI”,那就是Google和亚马逊。
业界认为,MI300X若能在2024年上半开始出货,可满足科技业者对于AI模型的庞大需求。相较英伟达产品,MI300系列的性能更高且成本较便宜下,有助降低AI模型开发的成本,也让英伟达直接面临竞争压力。
AMD预期对数据中心的AI加速器市场规模的预期也大幅上修,相较一年前AMD眼中的2027年市场规模仅1500亿美元,AMD修正后的看法是,2023年市场规模约450亿美元, 2027年将成长至4000亿美元。
4000亿美元市场规模之大,就算只取一瓢饮,也可以让AMD在AI领域取得非常好的成绩。市场则是预期,借着MI300声势浩大切入AI芯片领域,至少可取得10%市占率。
AMD面临的挑战是,已经采用英伟达H100的客户要导入其他的AI芯片,皆需投入额外的资源、时间和成本,端看客户是否愿意重新做投资到新的技术与生态。
面对英伟达GPU竞争力的强大护城河CUDA,AMD也有ROCm的软件生态一较高下。不过,ROCm的成熟度与CUDA相比真的是差得远了。
CUDA自2007年推出以来,经历过长达十年的研发期一直在烧钱,甚至直接影响英伟达的企业利润,也没有获得市场的认可,过程中是黄仁勋坚持CUDA一定要持续投资。十年的耕耘再回头看,这是个有远见的坚持,更在这一波AI大浪中成为最大受益者,英伟达的CUDA软件生态链已与AI生态深度绑定,成为企业竞争力的强大护城河。
AMD在CEO苏姿丰的领军下,上演过漂亮的咸鱼翻生仗,在服务器领域,藉由断开格芯GlobalFoundries的代工合作关系,转而与台积电的先进制程技术深度合作,更利用竞争对手英特尔制程延宕的弱点,一举打破英特尔在数据中心服务器领域稳固的江山,冲出一道破口。
如今,AMD是否能复制同样的故事到AI芯片领域,在英伟达盘踞90%市占率的江山中,至少拿下10%占有率,带领AMD重演当年漂亮的翻身仗?曾说过 “喜欢赢的感觉”的苏姿丰正在朝这个目标全力努力中。

