走进英伟达GTC，AI算力奇点颠覆未来- 大数跨境

首页

走进英伟达GTC，AI算力奇点颠覆未来

钛能AI实验室

2025-03-19

导读：刚刚，黄仁勋再次发布了全新一代核弹级 AI 芯片

大会概述

英伟达GTC (GPU Technology Conference) 2025大会于2025年3月17日至21日在美国加利福尼亚州圣何塞举行，会场设在圣何塞McEnery会议中心。作为全球领先的AI和加速计算盛会，GTC 2025汇聚了来自世界各地的开发者、研究人员、行业专家和企业领袖，共同探讨人工智能、加速计算和图形领域的最新进展和创新成果。

本届GTC大会的主题是探索加速计算和人工智能的未来，英伟达CEO黄仁勋发表了主题演讲，重点介绍了NVIDIA系统支持的各种AI应用。大会涵盖了AI平台/部署、AR/VR、计算机视觉、数据中心、机器人技术等多个热点领域，并针对学院、航空航天、汽车、金融、医疗等行业设立了专门的会议议题。

GTC 2025的一大亮点是英伟达在AI硬件和软件方面的重大发布，展示了其在AI领域的技术实力和未来发展方向。

重磅产品详细分析

Blackwell GPU是GTC 2025上最受瞩目的产品之一，包括Blackwell Ultra和后续的Rubin系列。

Blackwell Ultra (B300)

技术细节：
Blackwell Ultra基于Blackwell架构，采用台积电3nm工艺。GB300芯片配备288GB HBM3e内存，拥有15PF的稠密FP4算力。Blackwell Ultra NVL72平台（拥有72颗GB300）预计于2025年下半年推出，算力是GB200 NVL72的1.5倍。
性能提升：
英伟达声称，Blackwell系统比上一代Hopper系统强大40倍。Blackwell Ultra在推理模型中的性能提升达到Hopper的40倍，在通用应用中性能提升达到Hopper的25倍。
市场定位：
Blackwell Ultra专为AI推理而设计，尤其适用于需要自主推理和行动的Agentic AI，以及对机器人技术和自动驾驶汽车至关重要的Physical AI。Blackwell Ultra适用于需要自主推理和行动的代理AI。
重要性：
Blackwell Ultra旨在加速AI推理、降低推理成本，并促进AI技术在各行各业的普及。

Rubin系列

发布计划：
Rubin是Blackwell之后的下一代AI芯片，预计2026年下半年推出Vera Rubin NVL144，2027年下半年推出Rubin Ultra NVL576。
性能指标：
Rubin NVL144拥有75TB带宽和13TB/s的HBM4内存，性能是GB300 NVL72的3.3倍。Rubin Ultra NVL576拥有365TB带宽和4.6PB/s的HBM4e内存，性能是GB300 NVL72的14倍。Rubin的性能可达Hopper的900倍，而Blackwell是Hopper的68倍。
技术亮点：
Rubin将采用NVLink 144技术，并包含Vera（英伟达首款定制CPU设计）和Rubin GPU设计。
未来展望：
Rubin之后的下一代架构名为Feynman，预计2028年亮相。

市场意义

巩固英伟达在AI硬件领域的领导地位
为应对AI推理时代的算力需求提供强大支持
提升数据中心AI计算的效率和性能

RTX PRO Blackwell系列

为AI、技术、创意、工程和设计专业人士重新定义工作流程，增强AI推理、光线追踪和神经渲染。
针对数据中心、桌面和移动工作站的不同配置，工作站和服务器的内存高达 96GB，笔记本电脑的内存高达 24GB。

英伟达在GTC 2025上发布了Spectrum-X Photonics和Quantum-X Photonics两款光电一体化交换机平台，采用了硅光子技术。

Spectrum-X Photonics

基于以太网，适合兼容更广泛的企业网络
提供多种配置，包括128个800Gb/s端口或512个200Gb/s端口，总带宽达到100Tb/s；更高容量的型号提供512个800Gb/s端口或2048个200Gb/s端口，实现400Tb/s吞吐量。

Quantum-X Photonics

基于InfiniBand，偏向专用计算集群
具有144个800Gb/s InfiniBand端口，使用200Gb/s SerDes进行高效数据传输
采用液冷系统，以有效冷却板载硅光子器件，确保硅光子芯片在最佳效率下运行，避免过热。

技术特点

采用共封装光学器件 (CPO) 技术，将光通信直接集成到交换机上，实现更高带宽和更低功耗的数据传输。
总带宽可达400 Tb/s，每个端口的数据传输速度高达1.6 Tb/s。
功耗效率提高 3.5 倍，韧性提高 10 倍，部署时间加快 1.3 倍（与可插拔收发器相比）。

应用场景

大规模人工智能集群：支持包含数百万个GPU的集群，实现无缝协同工作。
数据中心：显著降低光模块的功耗，每个端口的功耗可从30瓦降低到9瓦，从而显著降低数据中心的整体功耗。

市场意义

为连接数百万块GPU做好准备，满足AI工厂的需求。
突破超大规模和企业网络的传统限制，为数据中心从万张GPU向百万张GPU的AI工厂过渡奠定基础。
提升数据传输速度、降低功耗、提高可靠性。

英伟达在GTC 2025大会上发布了一系列与机器人模型相关的技术和产品，尤其是在具身人工智能和人形机器人方面。

Isaac GR00T N1

全球首个开放且完全可定制的通用人形机器人基础模型。
特点是双系统架构，模仿人类的认知原理，包括一个快速思考的动作模型（System 1）和一个慢速思考的决策模型（System 2）。
GR00T N1可以通过NVIDIA Omniverse平台生成的大量合成数据进行训练，并且可以应用于物料搬运、包装和检测等场景。

Cosmos世界基础模型（WFMs）

包括Cosmos Transfer和Cosmos Predict等模型。
Cosmos Transfer可以将3D仿真或在Omniverse中创建的真实数据转换为照片般逼真的视频，用于大规模、可控的合成数据生成。

Newton物理引擎

与Google DeepMind和迪士尼研究院合作开发，旨在提高机器人处理复杂任务的精度。

Isaac GR00T蓝图

用于合成操作运动生成，可以利用少量的真实人类演示数据生成大量的合成运动数据。

市场意义

加速通用人形机器人推理和技能的开发。
降低机器人模型开发的成本和门槛。
推动机器人在工业、制造和服务领域的应用。

市场影响与行业评价

GTC 2025大会的发布对市场和行业产生了重大影响：

AI推理成为焦点：
大会传递出一个明确的信号，即AI推理时代已经到来，英伟达正在All in AI推理。
数据中心资本支出增长预期：
黄仁勋预测，到2028年，数据中心资本支出可能超过1万亿美元。
市场需求强劲：
英伟达表示，Blackwell的出货量正在激增，对AI计算的需求持续增长。
行业合作深化：
英伟达与通用汽车、百胜餐饮等公司的合作，表明其正在积极拓展AI在各行业的应用。
技术创新加速：
英伟达在GPU架构、网络技术、机器人模型等方面的创新，将推动AI技术的快速发展。
业内评价：

Semianalysis认为，英伟达在硬件和软件方面的推理效率提升，使得模型推理和智能代理的部署成本大幅降低。
市场曾担心DeepSeek式的软件优化以及英伟达主导的硬件进步带来的巨大成本节省，可能导致对AI硬件的需求下降。但英伟达认为，AI推理依然需要大量GPU和高性能网络。

写在最后

这场发布会本质是英伟达对 AI 时代的宣言：算力竞赛永不停歇。但老黄的野心不止于硬件。他首次公开硅光芯片进展，这种无需 EUV 光刻机的新型芯片，或将打破摩尔定律的物理极限。配合 NVLink 6 和 CX9 网络，英伟达正在构建 "AI 工厂" 生态，让推理成本下降超 25 倍。

英伟达的芯片与 DeepSeek 的突破，恰似 AI 江湖的 "双生花"。前者代表硬件极限的不断突破，后者展现算法创新的无限可能。但这场竞赛没有终点，当英伟达开始布局 2028 年的量子计算架构，当 DeepSeek 团队还在为 0.1% 的效率提升彻夜攻关，我们看到的不仅是技术的较量，更是国家战略意志的博弈。

或许正如 DeepSeek 突围的启示：在算力军备竞赛中，既要仰望星空追赶前沿，更要脚踏实地打磨内功。唯有将算法创新与生态自主双轮驱动，才能在这场没有硝烟的战争中真正 "赢麻了"。