大数跨境

深度剖析英伟达 B20、B30 与 B40:中国 AI 算力市场的新选择​

深度剖析英伟达 B20、B30 与 B40:中国 AI 算力市场的新选择​ 刚哥的运营笔记
2025-10-21
138
导读:本文来源硅基棠,作者酥酥学AI美国一系列出口管制政策的出台,使得英伟达不得不为中国市场量身定制特供版 GPU

本文来源硅基棠,作者酥酥学AI

美国一系列出口管制政策的出台,使得英伟达不得不为中国市场量身定制特供版 GPU 芯片。从早期的 A800、H800,到后来的 H20,这些芯片深刻影响着中国相关产业的发展步伐。如今,随着 H20 被禁,英伟达迅速做出反应,计划推出 B20、B30 与 B40 三款新的中国特供版 GPU。这三款芯片究竟有何独特之处?又将对中国市场产生怎样的影响?让我们深入探究一番。

|| H20:曾经的市场明星

在了解这三款新芯片之前,有必要先回顾一下 H20。H20 是英伟达于 2024 年专为中国市场设计的新一代受限版 H100,基于先进的 Hopper 架构。它拥有 96GB 的 HBM3 内存,内存带宽高达 4.0TB/s,在算力方面,FP8 性能为 296TFlops,FP16 性能为 148TFlops 。尽管相较于 H100,其 GPU 核心数量减少 41%,性能降低 28%,但它采用的 COWOS 先进封装技术,属于 2.5D 先进封装,能将不同芯片堆叠在同一片硅中介层实现多颗芯片互联,在推理计算领域仍具备显著优势。

H20 更适用于垂类模型训练、推理,尤其是DeepseekV3/R1这种大参数量,必须大显存的推理模型。虽无法满足万亿级大模型训练需求,但整体性能略高于 910B。不过,随着政策的变化以及市场需求的调整,H20 之后,新的特供阉割版 GPU 芯片应运而生。

图片

|| B20

B20 基于英伟达下一代 Blackwell 架构,是 B200 的阉割版,采用二代 4nm 工艺。面对芯片尺寸和出口管制的双重限制,英伟达另辟蹊径,利用 NVLink 高速互联技术,打造出一种全新的计算模式。即使单个 B20 芯片性能并非顶尖,但通过将它们组成超大型计算集群,就如同给战斗机装上多台发动机,能以集群的整体实力来提升计算能力,从而在特定场景下发挥作用。

虽然目前关于 B20 的具体性能参数并未完全公开,但从其作为 H20 的替代品以及与 B200 的关系可以进行一定推测。相较于 H20,在显存方面,B20 可能会采用 GDDR7 显存,这与 H20 的 HBM3 内存有所不同,显存带宽等性能可能会受到影响。在算力上,由于是阉割版,其单芯片的计算能力大概率低于 H20 以及 B200,不过通过集群互联后,在大规模计算任务上可能会展现出一定的竞争力。

英伟达推出 B20 的目标可能直指华为 910C ,尽管单芯片性能可能有取舍,但凭借集群计算能力和成熟的 CUDA 生态,试图在合规前提下,在特定场景下碾压对手,守住市场份额。

图片

|| B30

B30 芯片预计采用最新的 Blackwell 架构,基于 RTX 50 系列的 GB20X 核心打造。在显存方面,B30 使用 GDDR7 显存,带宽约为 1.7TB/s 。与 H20 的 HBM3 显存提供的 4.0TB/s 带宽相比,差距明显。这在面对大规模数据集和高分辨率图形渲染等对显存带宽要求苛刻的任务时,B30 可能会因数据传输瓶颈导致性能下降。例如在处理超高清视频编辑和大型 3D 游戏场景渲染时,B30 的显存带宽可能无法及时提供足够的数据,造成画面卡顿或处理速度缓慢。

图片

B30 首次支持多 GPU 扩展,这是其一大亮点。然而多 GPU 互联技术细节尚存在多种猜测,目前认为可能基于 ConnectX-8 SuperNICs 技术 ,该技术将 PCIe Gen6 交换机和高性能 SuperNIC 集成到单个设备中,旨在简化服务器设计。虽然目前 H20 的 NVLink 900GB/s 互联带宽是 B30 ConnectX-8 方案(100GB/s)的 9 倍,在多卡集群中表现出显著优势,但 B30 通过多 GPU 扩展,100 块 B30 组成的集群理论性能可达 H20 集群的 85% ,这使其在大规模计算任务中仍具备一定竞争力。

B30 的 Blackwell 架构理论上具备优秀的并行计算能力,然而由于其为符合出口管制要求,在设计上做出了诸多妥协。受显存带宽和架构调整影响,B30 单芯片在处理高精度计算任务,如 FP16 时,效率可能低于 H20 。不过其优势在于价格,售价预计在 6500 - 8000 美元之间 ,相较于 H20 芯片的 1 - 1.2 万美元 ,价格降低约 40% 。这样的价格定位使其在面对对成本敏感的客户群体时具有一定吸引力,适合预算有限但需要一定算力的企业,例如一些初创企业和中小企业,它们希望在有限的预算内搭建 AI 计算平台,B30 提供了一个相对经济的选择。

B30的应用场景主要有以下几个:

中小模型训练与推理:通过其多 GPU 扩展能力,能够构建高性能计算集群,为中小模型训练提供强大支持。例如,100 块 B30 组成的集群,理论性能可达 H20 集群的 85%,但采购成本仅需 60%。对于推理任务,在一些对单卡带宽要求不高的场景,如文本生成、客服机器人等,B30 能够提供稳定高效的推理性能。

云服务提供商:凭借其高性价比,成为云服务提供商的理想选择。其集群方案能够在较低成本下提供可用的算力支持,满足中小规模计算需求。云服务提供商可以利用 B30 的多 GPU 扩展能力,快速搭建和扩展算力资源,为用户提供更具竞争力的 AI 服务。

中小企业与学术研究:中小企业可以利用 B30 的多 GPU 扩展能力,快速搭建 AI 模型训练平台,提升业务效率和竞争力。在学术研究领域,一些对算力需求不是极度苛刻的科研项目,如基础算法研究、小规模模型训练等,B30 可以作为低成本的计算平台,支持科研人员进行模型训练和实验。

一文读懂 NVIDIA B30 与 H20 的区别 :参数、应用与国产替代全解析_云服务

|| B40

B40 同样基于 Blackwell 架构,与 Hopper 架构的 H20 不同,在架构层面就展现出了新的特性。随着英伟达架构的不断演进,Blackwell 架构首次全面支持 DisplayPort 2.1 UHBR20(80Gbps),突破 DisplayPort 1.4a 的限制,还将支持 PCIe 5.0,这些特性可能会在 B40 上有所体现,为数据传输等带来新的提升。

据相关研报分析,B40 预计将搭载 GDDR7 显存,其带宽约为 1.7TB/s,相比 H20 的 4TB/s 大幅降低。该芯片的 NVLink 单向传输速度约为 550GB/s,并将继续支持 CUDA。从这些参数可以看出,B40 在内存带宽等关键性能上被进一步阉割,这主要是为了符合美国的出口管制政策。不过,其依然支持 CUDA,这对于依赖英伟达 CUDA 生态的企业和开发者来说,在软件兼容性上有一定的优势,能够在一定程度上延续之前基于英伟达 GPU 的开发和应用。

预计 B40 将在 7 月初发布,出货量预计在 2025 年底达到约 100 万片,售价可能高达约 7000 美元(约合人民币 50424 元)。中金公司旗下 GF Securities 在研报中认为,B40 以 GDDR7 取代 HBM、减少 CoWoS 封装,不仅能够规避美国禁令,而且在性能牺牲不大的前提下,将单卡成本拉低至 6500 - 8000 美元,成为当前最具竞争力的境外 AI 加速器之一 。来自 Jefferies 的分析师指出,B40 在带宽上限内的存储子系统设计与 Blackwell 架构的效能优化,将使其在主流大模型训练与推理场景中保持不俗表现。硬件媒体 Tom’s Hardware 评论称,B40 并非 “顶配” 方案,但针对目前中国市场对 AI 算力需求的刚需和监管环境的复杂性,B40 在短期内或将成为科研机构与 AI 企业补充算力的首选 。

|| 对中国市场的影响

这三款芯片的推出,无疑将对中国市场产生多方面的影响。对于依赖英伟达 GPU 及 CUDA 生态的企业和开发者来说,B20、B30 与 B40 在一定程度上能够缓解因政策限制导致的算力短缺问题,并且凭借英伟达成熟的软件生态,能够在一定程度上延续相关业务的发展。然而,从另一个角度看,这些特供版芯片性能上的阉割以及价格定位,也给国产 GPU 芯片带来了机遇与挑战。国产 GPU 厂商需要加快技术研发步伐,提升产品性能与生态建设,以应对英伟达这些新芯片的竞争,同时也要抓住国产替代的市场机遇,在特定领域发挥自身优势,逐步提升市场份额。

总体而言,英伟达 B20、B30 与 B40 的到来,将使中国 AI 算力市场的竞争格局更加复杂多变,未来市场如何发展,让我们拭目以待。


—— 说在最后——

无论是英伟达为中国量身定制的“阉割版”H20,亦或者是预计推出全新的B20、B30 与 B40,芯优博泰一直积极参与行业前沿技术的研究与探索,不断将最新的技术成果应用于维修服务中,确保公司能够始终为客户提供最先进、最有效的技术解决方案。

熟练掌握各类先进检测技术和维修工艺,配备国际领先的检测维修设备,无论是电路板级的深度维修,还是系统层面的复杂调试,都能确保故障排查精准无误、维修操作高效规范。

我们致力于成为客户背后坚实的技术后盾,实时响应、全程护航,让您的算力设备始终稳定运行,业务永不停机。

【声明】内容源于网络
0
0
刚哥的运营笔记
跨境分享舍 | 长期分享行业参考
内容 43001
粉丝 7
刚哥的运营笔记 跨境分享舍 | 长期分享行业参考
总阅读644.6k
粉丝7
内容43.0k