H20还是被禁了,前几天刚刚传出老黄和川普谈好了,英伟达承诺5000亿的制造回流,相当于给川普交了保护费,就是H20还是得继续卖给中国。结果这才几天,又变卦了。
SemiAnalysis的Dylan认为这次单纯的禁掉H20是非常愚蠢的,当然他是站在老美的角度。
这篇文章我们就来聊一聊H20为什么被禁,以及被禁后有什么影响?
根据大摩的这篇分析,英伟达H20目前库存55亿美元,相当于潜在收入损失超120亿美元,毛利率近60%。2024年,H20在中国卖出170多亿美元,占其总营收的13%左右。
为何中国需要这么多的H20?
H20是专为中国特供,性能比H100阉割了80%,具体参数如下:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
虽然在训练或高算力场景下,H100还是目前最强的(考虑Blackwell还没有量产出货),但H20的显存容量(96GB,部分版本141GB)和带宽(4.0 TB/s)优于H100(80GB,3.35 TB/s)。这使得H20在显存密集型任务(如大语言模型推理阶段)表现较强。
而国内目前买的这些H20,也基本是用于推理的场景。
H20相对于产品GPU,有哪些优势?
-
成熟的cuda生态,中国大多数AI企业基于CUDA开发应用,H20可无缝集成,无需耗费成本和时间迁移软件; -
H20的显存容量和显存带宽,远超大多数国产GPU(如昇腾910B的带宽约为H20的一半)。这使得H20在显存密集型任务(如大语言模型推理)中效率极高; -
H20的热设计功耗(TDP)为400W,低于H100的700W,且比部分国产GPU更高效。这降低了大规摸数据中心的运营和冷却成本。 -
H20的杀手锏并非单卡算力,而是其互连带宽(interconnect bandwidth)和低延迟通信能力。这些特性使得多GPU集群能高效协同工作,而这正是运行复杂推理任务(如多步骤逻辑推理、实时决策)的核心需求。
为什么美国非要禁掉H20?
当前美国对华芯片出口管制的核心目标是限制中国训练前沿AI模型的能力,但如今推理(Inference)的AI创新——正成为更关键的战场。而英伟达的H20 GPU恰恰暴露了现有出口管制策略的致命漏洞:它看似“合规”,却为我国提供了足以支撑大规模推理的算力,直接威胁美国技术优势。
我们在上面提到了H20的优势,华为昇腾910C等国产芯片虽在单卡性能上追赶,但互连带宽仅达H20的1/3,延迟高出2倍以上。
近期DeepSeek发布后,字节、腾讯等企业紧急加单H20芯片,计划构建超10万卡规模的推理集群,直接服务于内容审核、社交推荐等场景。
出口管制通常需要1-2年才能产生实质影响,而我国的企业正利用这一时间差疯狂囤积H20(2024年已采购超100万张)。若不立即封堵这个美国认为的漏洞,待推理成为主流计算范式时,中国将手握成熟硬件体系,美国再限制为时已晚。
其实说白了,还是老美太害怕我们在AI上超越他们,即便禁了英伟达的显卡,随着我们国产GPU的崛起,我们都有信心会追赶并超越美国。
现在禁掉H20,有哪些影响?
这次政策成出台,刚巧是在华为的CloudMatrix 384架构刚刚发布。我们昨天的文章也刚刚讲过CloudMatrix 384,有兴趣的朋友可以看下。
SemiAnalysis--关于华为CloudMatrix和910C的分析
这个架构其实主要还是为了训练,对标的也是英伟达的GB200,如果从单颗GPU的性能来看,昇腾910C只有GB200的的30%,但由于CloudMatrix 384使用了384颗昇腾910C,因此系统的计算能力是GB200的1.7倍。HBM的容量和带宽分别是GB200的3.6倍和2.1倍。
华为的GPU进展能这么快,也是多亏了2022年H100/A100的禁令,迫使国内不得不慢慢转向国产GPU。而这次的H20禁令也会是同样的效果,当前的禁令对美国来说顶多算是“锦上添花”,而非决定性打击。
但由于我们目前还是有H20的需求,因此中国企业可能转向黑市或云服务获取英伟达芯片(如通过新加坡、马来西亚等中介),但成本高昂(A100黑市价格达2万美元/片,是美国市场的两倍)。有些依赖CUDA生态和H20的AI企业可能因切换国产GPU需要重构软件,面临项目延迟和开发成本增加。这些都是我们不得不面临的问题。
所以笔者认为,这次美国对H20的出口限制在短期内会对中国AI推理市场造成一定供需压力、成本上升和项目延迟,尤其影响依赖CUDA生态的中小型企业。然而,随着华为昇腾910B/C、壁仞BR100等国产GPU性能提升,政策支持和软件生态改进,禁令的长期效果显著减弱。国产GPU在推理任务中虽暂未完全媲美H20,但在训练和特定场景下已具竞争力,结合囤货、黑市和云服务,中国可有效应对禁令。禁令反而可能加速国产GPU替代,促使中国AI芯片产业自立,削弱美国的技术遏制效果,同时对英伟达造成市场损失。
文章内容来自网络,如侵权请联系
投稿、商务合作请微信dolphinjetta
是说芯语,欢迎关注分享

