大数跨境
0
0

老黄All in物理AI!最新GPU性能5倍提升,还砸掉了智驾门槛

老黄All in物理AI!最新GPU性能5倍提升,还砸掉了智驾门槛 量子位
2026-01-06
11
导读:5年CES首次不发游戏显卡全力搞AI
西风 闻乐 发自 凹非寺
量子位 | 公众号 QbitAI

1月6日,英伟达CEO黄仁勋身着鳄鱼皮夹克亮相CES 2026,发布全栈AI新品。这是英伟达五年来首次未在CES发布游戏显卡,标志着其战略重心全面转向AI基础设施与生态构建。

新一代Rubin架构GPU在NVFP4数据格式下,推理与训练性能分别为Blackwell GB200的5倍和3.5倍,引发业界对技术代际差距的广泛讨论。

本次发布覆盖五大核心方向:

  • NVIDIA Nemotron:面向Agentic AI的开源模型家族
  • NVIDIA Cosmos:面向物理AI的合成数据生成平台
  • NVIDIA Alpamayo:面向安全推理的自动驾驶VLA模型系列
  • NVIDIA Isaac GR00T:面向类人机器人的视觉-语言-行动(VLA)推理模型
  • NVIDIA Clara:面向医疗健康与生命科学的垂直AI工具

英伟达同步宣布持续开源训练框架与多模态数据集,包括10万亿语言token、50万条机器人轨迹、45.5万个蛋白质结构及100TB车辆传感器数据。

国产开源模型DeepSeek、Kimi K2、Qwen亦出现在发布会PPT中,体现中国AI模型在全球技术演进中的关键地位。

正式推出Vera Rubin NVL72机架架构

英伟达发布下一代AI数据中心核心机架——Vera Rubin NVL72,由六大组件构成:Vera CPU、Rubin GPU、NVLink 6交换芯片、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6以太网交换机。

Rubin GPU在NVFP4格式下推理性能达50 PFLOPS(+400%),训练性能为35 PFLOPS(+250%);单GPU集成8组HBM4内存,总容量288GB、带宽22 TB/s。

为应对MoE模型对节点间通信的严苛需求,Vera Rubin搭载全新NVLink 6互连技术:单GPU双向带宽3.6 TB/s;单颗交换芯片28 TB/s;整机架9颗芯片实现260 TB/s规模内总带宽。

Vera CPU集成88个定制Olympus Arm核心,支持176线程并发;NVLink C2C互连带宽提升至1.8 TB/s;每颗CPU可寻址最高1.5 TB SOCAMM LPDDR5X内存,带宽达1.2 TB/s。

为支撑超大规模集群部署,英伟达推出两款基于Spectrum-6芯片的液冷以太网交换机:SN688(409.6 Tb/s总带宽)、SN6810(102.4 Tb/s),均采用共封装光学(CPO)技术,显著提升能效与可靠性。

针对KV Cache成为大模型推理瓶颈的问题,英伟达推出BlueField-4 DPU,构建“推理上下文内存存储平台”,实现键值缓存的跨节点高效共享与复用,提升Agentic AI系统的响应速度、吞吐能力与扩展性。

Vera Rubin首次将可信执行环境扩展至整机架级别。单机架性能指标如下:

  • 3.6 exaFLOPS NVFP4推理性能
  • 2.5 exaFLOPS NVFP4训练性能
  • 54 TB LPDDR5X内存(连接Vera CPU)
  • 20.7 TB HBM4内存,总带宽1.6 PB/s

机架级优化还包括无缆化模块托盘、增强型NVLink弹性维护、第二代RAS引擎,支持零停机健康检测与热插拔升级。

相较Blackwell,Vera Rubin在MoE模型训练中GPU用量减少至1/4;MoE推理场景下每token成本最高降低10倍,同等空间内可大幅提升吞吐量与token生成效率。

目前六类核心芯片均已量产交付,规模化量产预计于2026年下半年启动。

自动驾驶全新开源模型系列Alpamayo发布

英伟达推出全球首款开源、大规模自动驾驶视觉-语言-行动(VLA)推理模型——Alpamayo 1(100亿参数),支持车辆运动历史、多路实时视频与用户指令三路输入,输出驾驶决策、因果解释与规划轨迹。

配套开源仿真框架AlpacaSim,支持复杂边缘场景下的闭环训练与评估;同步发布1700小时全球多地域驾驶数据集,覆盖大量罕见与高难度真实路况。

Alpamayo将首发搭载于2025年第二季度欧洲上市的梅赛德斯-奔驰CLA车型,通过OTA逐步开放高速公路脱手驾驶、城市全场景自动驾驶及端到端自动泊车功能,并计划拓展至美国市场。

英伟达同步展示其L4级自动驾驶与Robotaxi生态系统全景图,覆盖软件开发商、整车厂/出行平台、硬件供应商全链条。

Nemotron再推专项模型

NVIDIA Nemotron基于Nemotron 3开放模型与数据基础,新增三大专项模型:

  • Nemotron Speech:新一代自动语音识别(ASR)模型,支持实时低延迟字幕生成,速度较同类模型快10倍;已获博世应用于车载人机交互。
  • Nemotron RAG:视觉语言模型,强化多语言、多模态文档搜索能力,显著提升检索精度与效率。
  • Nemotron Safety:内容安全与敏感信息检测模型,含支持多语种的Llama Nemotron内容过滤模型及高精度PII识别模型。

机器人推理大脑Cosmos升级

英伟达升级物理AI核心平台Cosmos,发布三大新模型:

  • Cosmos Reason 2:新一代视觉-语言推理模型(VLM),提升机器人对物理世界的感知、理解与交互能力。
  • Cosmos Transfer 2.5Cosmos Predict 2.5:可生成大规模合成视频,适配多种环境与条件。

同步推出专用开源模型与参考蓝图:

  • Isaac GR00T N1.6:面向类人机器人的开源VLA推理模型,支持全身控制,集成Cosmos Reason以强化上下文推理能力。

  • NVIDIA AI Blueprint for Video Search and Summarization:Metropolis平台组成部分,提供视频分析智能体构建的工作流参考,适用于运营提效与公共安全场景。

Salesforce、Uber、Hitachi、VAST Data等企业正基于Cosmos Reason开发交通与职场AI智能体;Franka Robotics、NEURA Robotics等则利用Isaac GR00T开展机器人行为仿真、训练与量产前验证。

面向医疗健康与生命科学的AI工具集Clara

NVIDIA Clara聚焦医疗科研与临床应用衔接,加速数字成果向实际治疗转化,包含多款垂直领域模型:

  • La-Proteina:支持原子级精度大型蛋白质设计;
  • ReaSyn v2:在药物发现早期即融入生产工艺可行性评估;
  • KERMT:预测候选药物体内代谢路径与潜在毒性反应;
  • RNAPro:解析RNA分子3D结构,助力个性化诊疗方案开发。

英伟达同步开源含45.5万个合成蛋白质结构的数据集,全面支持生物医药AI研发。

【声明】内容源于网络
0
0
量子位
各类跨境出海行业相关资讯
内容 14606
粉丝 0
量子位 各类跨境出海行业相关资讯
总阅读107.5k
粉丝0
内容14.6k