
10月25日,英伟达在向美国证券交易委员会(SEC)递交了一份文件中披露,美国政府要求英伟达最新AI芯片出口管制规则立即生效,将影响公司A100、A800、H100、H800和L40S产品。
英伟达A800,是此次管制之前,中国企业能从英伟达等美国芯片厂商手中采购到最高端的AI芯片,也是目前中国科技企业在大模型训练、推理中使用最广泛、需求量最大的芯片。
早在10月17日美国政府颁布新的管制条例后,国内厂商就疯狂向英伟达下单,据媒体报道,英伟达的A800/H800芯片订单需求已经排期至2024年年中。管制提前,意味着国产大模型预想中利用“窗口期”囤货的计划落空,正规渠道无法再多交付哪怕一片高性能GPU。
AI的发展离不开大算力、强算法、大数据三大要素,GPU需求的高速增长几乎毋庸置疑。在美国屡次禁售高速GPU的背景下,国产AI芯片能否撑起一片天?

卡脖子已不是第一次
为了限制中国人工智能等高科技产业的发展,早在2022年10月7日,美国政府就规定算力上限为4800以及带宽上限超过600 GB/s的AI芯片禁止向中国出口。这两条红线直接导致英伟达的A100、H100以及AMD的MI300系列成为管制对象。
然而,作为以盈利为目的而运营的商业化公司,英伟达并不愿意放弃中国市场,因此针对中国市场特意推出了A800和H800芯片。其中,英伟达A800主要替代的是A100芯片,在数据传输速率上为每秒400GB,低于A100的每秒600GB。在内存带宽上最高达2TB/s,除了性能有所下降外,其他参数变化不大。

近年来,随着生成式AI兴起,字节跳动、腾讯、阿里巴巴、百度等云大厂和互联网巨头争先抢滩AI大模型,算力需求激增,带动了AI芯片需求不断增长。今年8月,权威媒体报道称,包括阿里、腾讯、字节跳动、百度等在内的中国企业共订购了50亿美元的A800芯片,预计2023年-2024年交付。
中国AI领域的快速发展让此前的禁令形同虚设。意识到此前禁令规则的巨大漏洞后,10月17日,美国商务部工业和安全局(BIS)针对中国更新了“先进计算芯片和半导体制造设备出口管制规则”,其中主要包括:
一、把性能密度作为出口管制标准。来自英伟达、AMD、英特尔的一批AI芯片被限制销往中国。
二、先进芯片出口许可范围扩大到40多个国家和地区。目的是,防止先进AI芯片从其他国家辗转进入中国。
三、对21个国家和地区提出了芯片制造设备的许可要求,并扩大禁止进入这些国家的设备清单。此举旨在限制中国获取14纳米以下先进芯片制造能力。
四、把包括摩尔线程、壁仞科技及其子公司在内的1部分中国GPU(图形处理芯片)企业列入了实体清单。目的是,限制中国创业企业从台积电代工先进芯片。
“出口管制规则”原定有30天公示期,即11月17日生效。这30天被行业人士视为“最后窗口期”。在窗口期内,中国企业仍可以集中采购、运输急需的高端AI芯片。但美国政府让管制提前生效,无疑阻断了英伟达在宽限期紧急交付的可能性,一位ICT企业高管10月25日确认,英伟达已经无法下单,也无法发货。

断供影响几何?
目前在GPU领域,大部分国内企业仍然只能仰赖英伟达一家的技术。由于美国政府收紧对华出口管制,以及AI大模型带来的庞大算力需求,英伟达的高性能GPU处理器一度“一芯难求”。
从去年开始,英伟达旗下A100、H100、A800、H800等高性能GPU芯片应声涨价,尤其旗舰级芯片H100,4月中旬在海外电商平台就已炒到超4万美元,甚至有卖家标价6.5万美元一片。

即便价格不断暴涨,国内大厂也不得不大批量买芯片。
其中,字节跳动今年已向英伟达订购了超过10亿美元的GPU产品,仅字节一家公司今年的采购量就已经接近英伟达去年在中国销售的商用GPU总销售额。
一个共识是,阿里、腾讯、字节跳动、百度等科技企业的AI训练和推理高度依赖英伟达的A100/H100、A800/H800、L40S等AI芯片。美国的断供将在中短期内延缓中国AI大模型升级迭代速度,国际市场调研机构Counterpoint估算,目前中国企业落后OpenAI的GPT-4等顶尖AI大模型大约2.5年至3年。虽然芯片获取并非决定性因素,但该机构认为,中国与全球同行的这一差距,将在未来几年继续拉大。
庆幸的是,在管制实施前包括腾讯、百度、阿里巴巴、字节跳动等大厂已经提前进行了AI芯片的大量囤货,估计能够一定程度上降低影响。
对于出口管制规则提前生效,英伟达表示,鉴于全球对该公司的产品需求强劲,短期内不会对公司财务业绩产生有实质意义的影响。
而深度科技研究院院长张孝荣却指出,禁售影响对英伟达的影响是巨大的,禁止向中国出口先进的AI芯片将使其失去重要的市场份额和收入来源。此举将对英伟达的业绩和盈利能力产生负面影响,并可能导致其股价继续下跌。
两个月前,英伟达交出了一份靓丽二季度的财报:营收创历史新高,达135.1亿美元,同比增长101%;其中数据中心业务收入103亿美元,同比增长170%;净利润达61.88亿美元,同比暴涨843%。来自中国的需求占英伟达数据中心收入的20%至25%。
从长远来看,新管制一旦实施,或将倒逼中国企业规模化采购国产芯片,进而导致美国芯片厂商逐步丧失在中国市场的竞争优势和领先地位。

国产芯片将崛起?
此前,中国企业还能在国产芯片、英伟达等国际企业的高端AI芯片之间做选择。考虑到性能、成本,中国企业往往更愿意选择英伟达的芯片。
最新的“出口管制规则”出炉之后,中国企业已没有选择空间。一位云厂商高管表示,美国“出口管制规则”步步紧逼的情况下,行业内包括华为、百度、阿里巴巴、腾讯等为代表的科技巨头,在实现自身快速发展的同时,也在力求突破封锁,努力实现国内AI芯片的自主可控。

目前国产AI芯片对英伟达AI芯片的可替代方案不少,一批企业陆续推出了AI芯片。其中,华为在AI领域推出的昇腾 910,采用7nm工艺,半精度(FP16)算力达到320TFLOPS,整数精度(INT8)算力达到640TOPS,就单卡表现来说,在推理性能上大概能够达到英伟达A100的80%,在训练性能上达到70%。百度昆仑芯推出训推一体AI芯片R200,采用7nm制程,INT8算力达256TOPS,累计订单已经超过千万级;而腾讯控股的燧原科技推出的i20、T21等训练推理产品,算力可媲美7nm GPU达到256TOPS,可满足数据中心等多种场景算力的需求。
值得一提的是,虽然近年来国内AI芯片发展较快,但与英伟达的A100/H100系列以及和AMD的MI250/300系列等旗舰产品相比,在性能和生态上还有一定差距。
目前昇腾910是业界算力最强的AI处理器,芯片基于自研华为达芬奇架构3D Cube技术,算力是英伟达V100的两倍。但当前大模型训练几乎都要使用32位的浮点,而昇腾910不支持32位浮点,所以只能用于华为自身生态中的大模型业务。
国内已经批量生产的AI芯片,大多都是A100的上一代。目前能运行大模型训练的,还是英伟达的A100、A800、H100、H800效率最高。在崇尚效率的大模型赛道,时间有时比金钱更重要。所以尽管英伟达GPU价格贵,但实际用起来反而是最便宜的。
这里存在一个循环的矛盾。AI芯片只有在实际应用中才能够发现问题、加快迭代,国产芯片起步晚、性能不足,所以国内厂商不愿意使用,而缺乏实际应用造成了国产芯片无法获得正向反馈,发展速度更慢。
从产业链发展来看,只有先买起来、用起来,国产芯片才能从能用变得好用。这是必经的一步。因此,美国出口政策收紧,虽然短期内阻碍在中国AI行业的发展进程,但国内巨大的市场体量和快速迭代的发展趋势,将为众多国产AI芯片厂商提供丰富的试验基地和应用设计机会。在“国产替代”成为唯一破局之法的背景下,“AI算力国产化”的市场大门,正在逐步打开。

美国限制出口政策的收紧,又一次为国内厂商敲响了警钟,从另一个角度来说,这也为国内AI芯片企业提供了新的机遇窗口。
在“缺芯”的形势下,国内大模型厂商可以在不是特别商业化的场景多给国产芯片机会,支持国产芯片厂商技术迭代,共同营造生态,共同成长。尽管接下来中国企业会迎来一段痛苦的过渡期,但从长远来看,这是不得不走也是唯一正确的路。

获悉新能源最新资讯解读行业热门话题
更多精彩内容敬请
关注视频号【苏昕Andy】
跟易能时代CEO一起走进新能源世界






