英伟达GTC (GPU Technology Conference) 2025大会于2025年3月17日至21日在美国加利福尼亚州圣何塞举行,会场设在圣何塞McEnery会议中心。作为全球领先的AI和加速计算盛会,GTC 2025汇聚了来自世界各地的开发者、研究人员、行业专家和企业领袖,共同探讨人工智能、加速计算和图形领域的最新进展和创新成果。
本届GTC大会的主题是探索加速计算和人工智能的未来,英伟达CEO黄仁勋发表了主题演讲,重点介绍了NVIDIA系统支持的各种AI应用。大会涵盖了AI平台/部署、AR/VR、计算机视觉、数据中心、机器人技术等多个热点领域,并针对学院、航空航天、汽车、金融、医疗等行业设立了专门的会议议题。
GTC 2025的一大亮点是英伟达在AI硬件和软件方面的重大发布,展示了其在AI领域的技术实力和未来发展方向。
Blackwell GPU是GTC 2025上最受瞩目的产品之一,包括Blackwell Ultra和后续的Rubin系列。
Blackwell Ultra (B300)
- 技术细节:
Blackwell Ultra基于Blackwell架构,采用台积电3nm工艺。GB300芯片配备288GB HBM3e内存,拥有15PF的稠密FP4算力。Blackwell Ultra NVL72平台(拥有72颗GB300)预计于2025年下半年推出,算力是GB200 NVL72的1.5倍。 - 性能提升:
英伟达声称,Blackwell系统比上一代Hopper系统强大40倍。Blackwell Ultra在推理模型中的性能提升达到Hopper的40倍,在通用应用中性能提升达到Hopper的25倍。 - 市场定位:
Blackwell Ultra专为AI推理而设计,尤其适用于需要自主推理和行动的Agentic AI,以及对机器人技术和自动驾驶汽车至关重要的Physical AI。Blackwell Ultra适用于需要自主推理和行动的代理AI。 - 重要性:
Blackwell Ultra旨在加速AI推理、降低推理成本,并促进AI技术在各行各业的普及。
Rubin系列
- 发布计划:
Rubin是Blackwell之后的下一代AI芯片,预计2026年下半年推出Vera Rubin NVL144,2027年下半年推出Rubin Ultra NVL576。 - 性能指标:
Rubin NVL144拥有75TB带宽和13TB/s的HBM4内存,性能是GB300 NVL72的3.3倍。Rubin Ultra NVL576拥有365TB带宽和4.6PB/s的HBM4e内存,性能是GB300 NVL72的14倍。Rubin的性能可达Hopper的900倍,而Blackwell是Hopper的68倍。 - 技术亮点:
Rubin将采用NVLink 144技术,并包含Vera(英伟达首款定制CPU设计)和Rubin GPU设计。 - 未来展望:
Rubin之后的下一代架构名为Feynman,预计2028年亮相。
市场意义
-
巩固英伟达在AI硬件领域的领导地位 -
为应对AI推理时代的算力需求提供强大支持 -
提升数据中心AI计算的效率和性能
RTX PRO Blackwell系列
-
为AI、技术、创意、工程和设计专业人士重新定义工作流程,增强AI推理、光线追踪和神经渲染。 -
针对数据中心、桌面和移动工作站的不同配置,工作站和服务器的内存高达 96GB,笔记本电脑的内存高达 24GB。
英伟达在GTC 2025上发布了Spectrum-X Photonics和Quantum-X Photonics两款光电一体化交换机平台,采用了硅光子技术。
Spectrum-X Photonics
-
基于以太网,适合兼容更广泛的企业网络 -
提供多种配置,包括128个800Gb/s端口或512个200Gb/s端口,总带宽达到100Tb/s;更高容量的型号提供512个800Gb/s端口或2048个200Gb/s端口,实现400Tb/s吞吐量。 Quantum-X Photonics
-
基于InfiniBand,偏向专用计算集群 -
具有144个800Gb/s InfiniBand端口,使用200Gb/s SerDes进行高效数据传输 -
采用液冷系统,以有效冷却板载硅光子器件,确保硅光子芯片在最佳效率下运行,避免过热。 技术特点
-
采用共封装光学器件 (CPO) 技术,将光通信直接集成到交换机上,实现更高带宽和更低功耗的数据传输。 -
总带宽可达400 Tb/s,每个端口的数据传输速度高达1.6 Tb/s。 -
功耗效率提高 3.5 倍,韧性提高 10 倍,部署时间加快 1.3 倍(与可插拔收发器相比)。 应用场景
-
大规模人工智能集群:支持包含数百万个GPU的集群,实现无缝协同工作。 -
数据中心:显著降低光模块的功耗,每个端口的功耗可从30瓦降低到9瓦,从而显著降低数据中心的整体功耗。 市场意义
-
为连接数百万块GPU做好准备,满足AI工厂的需求。 -
突破超大规模和企业网络的传统限制,为数据中心从万张GPU向百万张GPU的AI工厂过渡奠定基础。 -
提升数据传输速度、降低功耗、提高可靠性。
英伟达在GTC 2025大会上发布了一系列与机器人模型相关的技术和产品,尤其是在具身人工智能和人形机器人方面。
Isaac GR00T N1
- 全球首个开放且完全可定制的通用人形机器人基础模型。
-
特点是双系统架构,模仿人类的认知原理,包括一个快速思考的动作模型(System 1)和一个慢速思考的决策模型(System 2)。 -
GR00T N1可以通过NVIDIA Omniverse平台生成的大量合成数据进行训练,并且可以应用于物料搬运、包装和检测等场景。 Cosmos世界基础模型(WFMs)
-
包括Cosmos Transfer和Cosmos Predict等模型。 -
Cosmos Transfer可以将3D仿真或在Omniverse中创建的真实数据转换为照片般逼真的视频,用于大规模、可控的合成数据生成。 Newton物理引擎
-
与Google DeepMind和迪士尼研究院合作开发,旨在提高机器人处理复杂任务的精度。 Isaac GR00T蓝图
-
用于合成操作运动生成,可以利用少量的真实人类演示数据生成大量的合成运动数据。 市场意义
-
加速通用人形机器人推理和技能的开发。 -
降低机器人模型开发的成本和门槛。 -
推动机器人在工业、制造和服务领域的应用。
GTC 2025大会的发布对市场和行业产生了重大影响:
- AI推理成为焦点:
大会传递出一个明确的信号,即AI推理时代已经到来,英伟达正在All in AI推理。 - 数据中心资本支出增长预期:
黄仁勋预测,到2028年,数据中心资本支出可能超过1万亿美元。 - 市场需求强劲:
英伟达表示,Blackwell的出货量正在激增,对AI计算的需求持续增长。 - 行业合作深化:
英伟达与通用汽车、百胜餐饮等公司的合作,表明其正在积极拓展AI在各行业的应用。 - 技术创新加速:
英伟达在GPU架构、网络技术、机器人模型等方面的创新,将推动AI技术的快速发展。 - 业内评价:
-
Semianalysis认为,英伟达在硬件和软件方面的推理效率提升,使得模型推理和智能代理的部署成本大幅降低。 -
市场曾担心DeepSeek式的软件优化以及英伟达主导的硬件进步带来的巨大成本节省,可能导致对AI硬件的需求下降。但英伟达认为,AI推理依然需要大量GPU和高性能网络。
这场发布会本质是英伟达对 AI 时代的宣言:算力竞赛永不停歇。但老黄的野心不止于硬件。他首次公开硅光芯片进展,这种无需 EUV 光刻机的新型芯片,或将打破摩尔定律的物理极限。配合 NVLink 6 和 CX9 网络,英伟达正在构建 "AI 工厂" 生态,让推理成本下降超 25 倍。
图片来源于网络
#AI 逆袭 #中国科技 #科技热点
👉 关注 @钛能 AI 实验室,获取最硬核的 AI 前沿资讯!

