英伟达CEO黄仁勋在CES 2026发布全新AI战略,首次未发布游戏显卡,全面转向AI全栈布局。
其核心是下一代Rubin架构GPU——推理与训练性能分别达Blackwell GB200的5倍和3.5倍(NVFP4格式)。
发布会聚焦五大AI领域新进展:
- 面向Agentic AI的NVIDIA Nemotron模型家族
- 面向物理AI的NVIDIA Cosmos平台
- 面向自动驾驶的全新NVIDIA Alpamayo模型家族
- 面向机器人领域的NVIDIA Isaac GR00T
- 面向生物医学的NVIDIA Clara
英伟达同步开源训练框架及多模态数据集,涵盖10万亿语言token、50万条机器人轨迹、45.5万个蛋白质结构、100TB车辆传感器数据。
本次发布以“物理AI”为统一主线,标志其技术护城河从芯片层延伸至模型、数据、工具全栈平台层。
国产大模型DeepSeek、Kimi K2、通义千问(Qwen)在演讲开篇及PPT中被重点提及。
正式推出Vera Rubin NVL72机架架构
英伟达正式发布新一代AI数据中心机柜架构Vera Rubin,由六大核心组件构成:
- Vera CPU(集成88核Olympus Arm,支持176线程)
- Rubin GPU(NVFP4下推理50 PFLOPS、训练35 PFLOPS)
- NVLink 6交换芯片(单颗28 TB/s,整机架共260 TB/s)
- ConnectX-9 SuperNIC
- BlueField-4 DPU(构建推理上下文内存存储平台)
- Spectrum-6以太网交换机
Rubin GPU采用8组HBM4内存,提供288GB容量与22 TB/s带宽;Vera CPU支持1.5TB SOCAMM LPDDR5X内存,带宽达1.2 TB/s;NVLink C2C互连带宽提升至1.8 TB/s。
为支撑超大规模MoE模型训练与推理,Vera Rubin引入三大关键升级:
- 无缆化模块托盘设计,提升组件更换效率
- NVLink弹性能力,支持零停机维护
- 第二代RAS引擎,实现运行中健康检测
相比Blackwell,Vera Rubin在MoE训练中GPU用量减少至1/4;MoE推理每token成本最高降低10倍。
整机架性能指标如下:
- 3.6 exaFLOPS NVFP4推理性能
- 2.5 exaFLOPS NVFP4训练性能
- 54 TB LPDDR5X内存(连接Vera CPU)
- 20.7 TB HBM4内存,带宽1.6 PB/s
配套Spectrum-X液冷以太网交换机SN688与SN6810均基于Spectrum-6芯片,分别提供409.6 Tb/s与102.4 Tb/s总带宽,支持高密度800G/200G端口配置,能效与可靠性显著优于传统硬件。
自动驾驶全新开源模型系列发布
英伟达发布面向安全推理的全新开源自动驾驶模型系列Alpamayo:
• Alpamayo 1:全球首款开源视觉-语言-行动(VLA)推理模型,参数量100亿。支持融合车辆运动历史、多摄像头视频与用户指令三类输入,输出驾驶决策、因果推理与规划轨迹。
• AlpacaSim:配套开源仿真框架,支持复杂边缘场景下的闭环训练与评估。
• 1700小时开源驾驶数据集:覆盖全球广泛地理区域与极端真实路况,专为推理架构验证优化。
Alpamayo将首发搭载于2025年第二季度欧洲上市的梅赛德斯-奔驰CLA车型,通过OTA逐步推送高速公路脱手驾驶、城市全场景自动驾驶及端到端自动泊车功能,并计划登陆美国市场。
英伟达同步展示L4级自动驾驶与Robotaxi全球生态全景图,覆盖整车厂、出行平台、软硬件供应商与开发者,构建端到端产业协作体系。
Nemotron再推专项模型
在Nemotron 3开放模型基础上,英伟达推出三大垂直场景专项模型:
- Nemotron Speech:新型ASR模型,支持实时低延迟字幕生成,速度较同类快10倍;博世已部署用于车载人机交互。
- Nemotron RAG:增强型视觉语言模型,支持多语言、多模态文档搜索,显著提升检索精度与效率。
- Nemotron Safety:含Llama Nemotron内容安全模型(多语言支持)与Nemotron PII模型(高精度敏感信息识别)。
机器人推理大脑Cosmos升级
Cosmos平台完成重大升级,强化物理AI数据生成与推理能力:
- Cosmos Reason 2:新一代视觉-语言推理模型(VLM),提升机器人对物理世界的感知、理解与交互能力。
- Cosmos Transfer 2.5 & Cosmos Predict 2.5:可生成大规模高质量合成视频,适配多环境、多条件仿真训练。
基于Cosmos,英伟达发布两款关键开源模型与参考方案:
- Isaac GR00T N1.6:专为类人机器人打造的VLA推理模型,支持全身控制,集成Cosmos Reason以增强上下文理解与推理能力。
- NVIDIA AI Blueprint for Video Search and Summarization:Metropolis平台组成部分,提供视频智能体构建参考工作流,支持录播/直播视频分析,提升公共安全与运营效率。
目前Salesforce、Uber、Hitachi、Franka Robotics、NEURA Robotics等企业已基于Cosmos Reason与Isaac GR00T开展交通管理、职场提效及机器人量产前仿真验证等工作。
针对医疗健康与生命科学的AI
NVIDIA Clara聚焦医疗健康与生命科学领域,旨在加速科研转化、降低研发成本、打通数字科研与临床应用壁垒。主要模型包括:
- La-Proteina:原子级精度大型蛋白质设计模型
- ReaSyn v2:在药物发现早期即融入可制造性评估
- KERMT:预测潜在药物人体代谢反应,前置安全性排查
- RNAPro:精准预测RNA分子三维结构,助力个性化治疗
英伟达同步开放含45.5万个合成蛋白质结构的开源数据集,全面支持生物医药研究。


