1. 核心硬件:Rubin架构正式登场
这是本次大会的绝对主角,旨在接替目前的Blackwell架构,重新定义AI训练与推理的算力标准。
Rubin GPU (R100/R200系列):
架构突破:
基于全新的Rubin架构,采用更先进的制程工艺(预计为台积电4nm或3nm增强版),显著提升能效比。
性能飞跃:
预计FP4/FP8算力相比Blackwell B200提升2-3倍,专门针对超大模型训练和实时推理优化。
内存革命:
首发搭载HBM4(高带宽内存第四代),带宽预计突破1.5TB/s甚至更高,彻底解决显存墙瓶颈。
变种型号:
可能推出Rubin CPX等特定场景变体,针对云服务商进行定制化优化。
2. 系统级创新:超级集群与互联技术
英伟达将展示如何将单卡性能转化为集群级的超级算力。
新一代NVLink与Switch:
配合Rubin架构,推出带宽更高的片间互联技术,支持更大规模的GPU集群(如NVL576甚至更大规模机柜),实现万卡级别的线性加速比。
VR200 NVL72/NVL576升级版:
展示基于Rubin芯片的新一代液冷机架解决方案,进一步优化数据中心的空间利用率和散热效率。
共封装光学 技术:
为解决高速信号传输损耗,可能会展示更成熟的CPO方案,将光引擎直接封装在芯片旁,大幅提升数据传输速度并降低功耗。
3. 生态与软件:Agent AI与物理仿真
除了硬件,软件生态的升级将是支撑“具身智能”和“代理式AI”的关键。
Project GR00T重大更新:
其人形机器人基础模型将迎来新版本,结合Rubin算力,展示更复杂的机器人运动控制与多模态理解能力,推动具身智能从实验室走向工厂。
NVIDIA NIM 微服务升级:
针对Agent AI(代理式人工智能),推出更高效的推理微服务,支持多Agent协作、长上下文记忆及自主任务规划,降低企业部署AI Agent的门槛。
Omniverse与物理AI:
发布新的物理仿真引擎更新,支持更精准的工业数字孪生和机器人训练环境,强调“物理AI”在制造业中的应用。
DLSS4.5/光线追踪新技术:
虽然GTC侧重B端,但通常也会展示面向游戏和图形领域的最新技术(如之前在GDC提到的DLSS 4.5与路径追踪),进一步巩固其在图形渲染领域的护城河。
4. 潜在惊喜:Feynman架构前瞻或专用芯片
Feynman架构预览:
虽然Rubin是主力,黄仁勋可能会简要透露再下一代Feynman架构的路线图,展示英伟达长期技术储备。
专用推理芯片:
面对日益增长的推理需求,可能会发布针对低延迟、高吞吐推理场景优化的专用芯片或加速卡,以应对云端大模型落地的成本挑战。
5、时间线与意义

