英伟达Nvidia指出,新款GPU旗舰型H100的营收贡献已超过 A100,市场采用度非常高。搭上近期ChatGPT热潮,人工智能的采用正处于一个拐点。 Open AI 的 ChatGPT 引起了全世界的关注,生成式人工智能大爆发。
在迎接ChatGPT狂潮前,英伟达遭遇过一段逆风。 2022年9月美国针对中国提出算力的限制,以英伟达的A100为界线,算力超过者就不能在中国销售,顿时让英伟达A100,以及当时即将要推出的H100这两颗GPU主力产品前景蒙尘。
这个重大逆风不单是影响到英伟达,台积电也被杀的措手不及。原本台积电打算规划的7nm和 5nm产能扩充,都因为英伟达的禁售令事件,成为压垮7nm和 5nm产能利用率的最后一根稻草。
套句热门标题,当时真的是“英伟达惊了,台积电慌了,整个业界都吓傻了!” 因为A100 GPU就是采用台积电7nm制程工艺,而规划推出的H100是采用5nm强化版本的4nm制程工艺。 A100和H100的禁售,对台积电7nm和5nm产能利用率又是另一番打击,不得不让产能转向。
由于该禁令对英伟达的潜在影响高达4亿美元。因此,英伟达也进行立刻进行斡旋,拿到许可将英伟达美国客户的A100芯片订单的出口限制宽限延后至2023年3月,且在2023年9月1日前可透过香港厂房供应AI芯片。
再者,英伟达也紧急推出针对中国市场的“降规格”(降速)版本A800系列,把算力调到限制指标之下,用来作为A100系列的替代方案。
随着A800进入量产,可望逐渐为台积电低迷不振的7nm制程产能利用率解套。
眼前正处人工智能的一个拐点,H100的Transformer引擎来的正是时候,服务于大型语言模型的开发和Scale Out推理。随着OpenAI推出的ChatGPT引爆全球狂热,Google、Amazon加入生成式AI大战,英伟达的GPU成为最大获利者。
英伟达最新一款GPU 新旗舰 H100在第二季度的收入就已经远高于 A100,显示市场接受度之热络。 H100 的训练速度比上一代A100 快 9 倍,比基于 transformer 的大型语言模型推理快 30 倍。
黄仁勋指出,生成式AI的多功能性和能力引发了全球企业开发和部署人AI战略的紧迫感。然而,人工智能超级计算机基础设施、模型算法、数据处理和训练技术仍然是大多数人无法跨越的障碍。英伟达的商业模式帮助每个企业客户触及 AI。
1965 年摩尔定律(Moore’s law)的提出,预测集成电路上可容纳的晶体管数目每 18个月便会增加一倍,成为过去半世纪以来,半导体行业的运行法则。日前英伟达也以创始仁黄仁勋(Jensen Huang)的名字提出“黄氏定律”(Huang’s Law),预测 GPU 将推动 AI 性能实现逐年翻倍。
黄仁勋指出,过去十年,在摩尔定律最好的日子里,AI 处理速度提高了 100 万倍。通过提出新处理器、新系统、新互连、新框架和算法,并与数据科学家、AI 研究人员合作开发新模型,在整个跨度内,英伟达成功使大型语言模型处理速度提高了一百万倍。
他也表示ChatGPT 是一项很棒的工作,OpenAI 坚持了下来且用它做得很好,所有突破的积累成为一种服务,其内部模型以其多功能性和能力让每个人都感到惊讶。

