老黄All in物理AI！最新GPU性能5倍提升，还砸掉了智驾门槛- 大数跨境

首页

老黄All in物理AI！最新GPU性能5倍提升，还砸掉了智驾门槛

量子位

2026-01-06

导读：5年CES首次不发游戏显卡全力搞AI

西风闻乐发自凹非寺
量子位 | 公众号 QbitAI

1月6日，英伟达CEO黄仁勋身着鳄鱼皮夹克亮相CES 2026，发布全栈AI新品。这是英伟达五年来首次未在CES发布游戏显卡，标志着其战略重心全面转向AI基础设施与生态构建。

新一代Rubin架构GPU在NVFP4数据格式下，推理与训练性能分别为Blackwell GB200的5倍和3.5倍，引发业界对技术代际差距的广泛讨论。

本次发布覆盖五大核心方向：

NVIDIA Nemotron：面向Agentic AI的开源模型家族
NVIDIA Cosmos：面向物理AI的合成数据生成平台
NVIDIA Alpamayo：面向安全推理的自动驾驶VLA模型系列
NVIDIA Isaac GR00T：面向类人机器人的视觉-语言-行动（VLA）推理模型
NVIDIA Clara：面向医疗健康与生命科学的垂直AI工具集

英伟达同步宣布持续开源训练框架与多模态数据集，包括10万亿语言token、50万条机器人轨迹、45.5万个蛋白质结构及100TB车辆传感器数据。

国产开源模型DeepSeek、Kimi K2、Qwen亦出现在发布会PPT中，体现中国AI模型在全球技术演进中的关键地位。

正式推出Vera Rubin NVL72机架架构

英伟达发布下一代AI数据中心核心机架——Vera Rubin NVL72，由六大组件构成：Vera CPU、Rubin GPU、NVLink 6交换芯片、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6以太网交换机。

Rubin GPU在NVFP4格式下推理性能达50 PFLOPS（+400%），训练性能为35 PFLOPS（+250%）；单GPU集成8组HBM4内存，总容量288GB、带宽22 TB/s。

为应对MoE模型对节点间通信的严苛需求，Vera Rubin搭载全新NVLink 6互连技术：单GPU双向带宽3.6 TB/s；单颗交换芯片28 TB/s；整机架9颗芯片实现260 TB/s规模内总带宽。

Vera CPU集成88个定制Olympus Arm核心，支持176线程并发；NVLink C2C互连带宽提升至1.8 TB/s；每颗CPU可寻址最高1.5 TB SOCAMM LPDDR5X内存，带宽达1.2 TB/s。

为支撑超大规模集群部署，英伟达推出两款基于Spectrum-6芯片的液冷以太网交换机：SN688（409.6 Tb/s总带宽）、SN6810（102.4 Tb/s），均采用共封装光学（CPO）技术，显著提升能效与可靠性。

针对KV Cache成为大模型推理瓶颈的问题，英伟达推出BlueField-4 DPU，构建“推理上下文内存存储平台”，实现键值缓存的跨节点高效共享与复用，提升Agentic AI系统的响应速度、吞吐能力与扩展性。

Vera Rubin首次将可信执行环境扩展至整机架级别。单机架性能指标如下：

3.6 exaFLOPS NVFP4推理性能
2.5 exaFLOPS NVFP4训练性能
54 TB LPDDR5X内存（连接Vera CPU）
20.7 TB HBM4内存，总带宽1.6 PB/s

机架级优化还包括无缆化模块托盘、增强型NVLink弹性维护、第二代RAS引擎，支持零停机健康检测与热插拔升级。

相较Blackwell，Vera Rubin在MoE模型训练中GPU用量减少至1/4；MoE推理场景下每token成本最高降低10倍，同等空间内可大幅提升吞吐量与token生成效率。

目前六类核心芯片均已量产交付，规模化量产预计于2026年下半年启动。

自动驾驶全新开源模型系列Alpamayo发布

英伟达推出全球首款开源、大规模自动驾驶视觉-语言-行动（VLA）推理模型——Alpamayo 1（100亿参数），支持车辆运动历史、多路实时视频与用户指令三路输入，输出驾驶决策、因果解释与规划轨迹。

配套开源仿真框架AlpacaSim，支持复杂边缘场景下的闭环训练与评估；同步发布1700小时全球多地域驾驶数据集，覆盖大量罕见与高难度真实路况。

Alpamayo将首发搭载于2025年第二季度欧洲上市的梅赛德斯-奔驰CLA车型，通过OTA逐步开放高速公路脱手驾驶、城市全场景自动驾驶及端到端自动泊车功能，并计划拓展至美国市场。

英伟达同步展示其L4级自动驾驶与Robotaxi生态系统全景图，覆盖软件开发商、整车厂/出行平台、硬件供应商全链条。

Nemotron再推专项模型

NVIDIA Nemotron基于Nemotron 3开放模型与数据基础，新增三大专项模型：

Nemotron Speech：新一代自动语音识别（ASR）模型，支持实时低延迟字幕生成，速度较同类模型快10倍；已获博世应用于车载人机交互。
Nemotron RAG：视觉语言模型，强化多语言、多模态文档搜索能力，显著提升检索精度与效率。
Nemotron Safety：内容安全与敏感信息检测模型，含支持多语种的Llama Nemotron内容过滤模型及高精度PII识别模型。

机器人推理大脑Cosmos升级

英伟达升级物理AI核心平台Cosmos，发布三大新模型：

Cosmos Reason 2：新一代视觉-语言推理模型（VLM），提升机器人对物理世界的感知、理解与交互能力。
Cosmos Transfer 2.5与Cosmos Predict 2.5：可生成大规模合成视频，适配多种环境与条件。

同步推出专用开源模型与参考蓝图：

Isaac GR00T N1.6：面向类人机器人的开源VLA推理模型，支持全身控制，集成Cosmos Reason以强化上下文推理能力。
NVIDIA AI Blueprint for Video Search and Summarization：Metropolis平台组成部分，提供视频分析智能体构建的工作流参考，适用于运营提效与公共安全场景。

Salesforce、Uber、Hitachi、VAST Data等企业正基于Cosmos Reason开发交通与职场AI智能体；Franka Robotics、NEURA Robotics等则利用Isaac GR00T开展机器人行为仿真、训练与量产前验证。

面向医疗健康与生命科学的AI工具集Clara

NVIDIA Clara聚焦医疗科研与临床应用衔接，加速数字成果向实际治疗转化，包含多款垂直领域模型：

La-Proteina：支持原子级精度大型蛋白质设计；
ReaSyn v2：在药物发现早期即融入生产工艺可行性评估；
KERMT：预测候选药物体内代谢路径与潜在毒性反应；
RNAPro：解析RNA分子3D结构，助力个性化诊疗方案开发。

英伟达同步开源含45.5万个合成蛋白质结构的数据集，全面支持生物医药AI研发。

【声明】内容源于网络

量子位

各类跨境出海行业相关资讯

内容 14606

粉丝 0

量子位各类跨境出海行业相关资讯

总阅读107.5k

粉丝0

内容14.6k