从GB200到Rubin,英伟达在AI服务器架构上的迭代正在掀起一场电源系统的革命。我们深入分析了这一变革背后的技术细节、供应链布局和成本结构,为大家揭示未来数据中心的发展方向。
Sidecar:从Power Shelf到独立机柜的华丽转身
英伟达最新一代的AI系统,特别是 Rubin NVL144,正逐步放弃传统的Power Shelf电源架构,转而采用一种名为 Sidecar 的独立机柜设计。
什么是Sidecar?
简单来说,Sidecar是一个专门存放电源、电池和液冷系统的“边柜”,它不再与计算单元混杂在同一个机架里。这一变革的目的是让IT机架专注于最核心的计算任务,从而大幅提升服务器的密度和功率。
Meta等科技巨头已开始部署第一代Sidecar方案,将其与GB300芯片和自研ASIC结合,用于处理前沿的AI应用。
Rubin的部署计划与未来兼容性
* 部署时间点: Rubin系统预计将在 2026年年中 小批量使用,并在下半年实现Sidecar的标配。
* 生命周期: Rubin的生命周期约为4年,与GB300有2年的重叠期。在此期间,一些客户可能会将GB300从现有架构迁移至Sidecar,因此Sidecar在设计上需要兼容GB300。
* 技术模块: Sidecar的部署涉及多个核心技术模块,包括高压直流(HVDC)电源、电源模组、超级电容、BBU(电池备用单元)和液冷系统等。
核心组件价值量测算:HVDC与PSU
在一个标准的Rubin机柜中,高功率的电源配置是成本的主要构成部分。
* HVDC配置: 一个标准Rubin机柜通常配置570kW到800kW的HVDC电源。以常见的570kW HVDC模组为例,其价值量高达 65万至68万元人民币。
* PSU方案: HVDC供电系统通常采用两种典型的PSU(电源供应单元)配置方案:
* 12kW PSU: 每个机架配备8个电源架(Power Shelf),每个电源架有12个12kW的PSU,总输出功率可达576kW。
* 19kW PSU: 每个机架配备30个19kW的PSU,总输出功率可达570kW。
这两种方案在成本上也有显著差异。目前,12kW PSU的量产价格约为 5.4万元人民币,而19kW PSU价格更高,单价接近 10万元人民币。
供应商方面,台达在HVDC功能框的研发上处于领先地位
超级电容与BBU:保障系统稳定性的“双保险”
在GB200架构中,由于缺乏对瞬态供电问题的解决措施,导致芯片和GPU卡返修率较高。GB300和Rubin则通过引入超级电容(超容)和BBU来解决这一痛点。
* 超级电容(Supercapacitor): 负责解决 微秒到毫秒级别 的瞬态供电问题。它能有效滤除不纯净的电源信号,防止过大的瞬时电流烧毁芯片。
* 成本构成: 一个标准配置包含14个超容箱,每个箱子有90片电容片,每片价值40元人民币,总价值量约为5万元人民币。
* 与牛角电容的对比: 牛角电容主要用于直流电输出的初级滤波,成本更低,但其性能无法取代超容在处理瞬态问题上的作用。一个2000W PSU对应的牛角电容成本仅为50元人民币左右,远低于超容。
* BBU(Battery Backup Unit): 负责解决 更长时间范围 内的供电稳定性问题,提供持续的备用电源。
* 成本构成: 一个140kW功耗的BBU系统大约需要1700颗18650规格电池。每颗电池成本约为1.5美元,总成本占据BBU材料成本的70%。最终,一个BBU的售价大致在 5000到6000美元 之间。
从GB200到GB300再到Rubin,英伟达在服务器电源架构上的革新不仅是功率的提升,更是可靠性和稳定性的系统性优化。随着AI芯片功耗的不断攀升,独立的Sidecar电源架构和高价值的HVDC、超容及BBU将成为未来数据中心的关键标配。

