大数跨境

黄仁勋CES2026演讲:AI推理成本暴降10倍,自动驾驶迎来“ChatGPT时刻”

黄仁勋CES2026演讲:AI推理成本暴降10倍,自动驾驶迎来“ChatGPT时刻” 具身涌现
2026-01-06
0
导读:CES,英伟达CEO黄仁勋再次身着标志性皮衣登台。与往年不同,这次他带来的不是单一产品,而是一套完整的AI推理时代基础设施解决方案。“每隔10到15年,计算行业就会革新一次。”黄仁勋开场便定下基调。幻

皮衣刀客又亮剑,从芯片到模型的全栈革命正在开启AI新纪元。

拉斯维加斯CES2026现场,英伟达CEO黄仁勋再次身着标志性皮衣登台。与往年不同,这次他带来的不是单一产品,而是一套完整的AI推理时代基础设施解决方案。

“每隔10到15年,计算行业就会革新一次。”黄仁勋开场便定下基调。他身后幻灯片赫然写着:“人工智能的发展超越了大型语言模型。”

这场演讲不仅发布了新一代Rubin GPU平台,更有面向自动驾驶的开源模型Alpamayo、物理AI世界模型Cosmos,以及机器人基础模型GROOT更新。英伟达正从硬件到软件,从训练到推理,全面布局下一代AI生态。

01 Rubin平台:推理成本的“价格杀手” 

黄仁勋展示的第一张性能对比图就引起轰动:全新Rubin GPU平台的推理token成本比Blackwell降低高达10倍。

具体来看,Rubin GPU的NVFP4推理算力达到50PFLOPS,是Blackwell的5倍;训练性能提升至35PFLOPS,增长3.5倍;HBM4内存带宽22TB/s,是前代的2.8倍。

但性能提升只是表象,Rubin架构的真正突破在于其协同设计理念。

六款新品——Vera CPU、Rubin GPU、NVLink 6 Switch、ConnectX-9 SuperNIC、BlueField-4 DPU和Spectrum-6 Ethernet Switch——被极致优化,共同构建了一台划时代的AI超算系统。

黄仁勋引入了一个关键概念:Test-time Scaling(推理时扩展)。简单来说,就是让AI“遇到问题时多想一会儿”。

传统AI能力提升依赖训练阶段投入更多算力,把模型越做越大。而现在,即使模型规模不变,只要在推理时给予更多计算资源,性能也能显著提升。

Rubin平台的核心使命就是让“AI多想一会儿”变得经济可行。NVL72机架级解决方案集成72个Rubin GPU,通过NVLink 6实现260TB/s的总带宽,“比整个互联网的带宽还多”。

02 破解存储瓶颈:推理上下文内存存储平台 

当AI进行多轮对话和复杂推理时,会产生海量上下文数据。传统架构要么占用昂贵GPU内存,要么存入访问缓慢的普通存储,形成“存储瓶颈”。

英伟达此次推出了由BlueField-4驱动的推理上下文内存存储平台,在GPU内存和传统存储间创建了“第三层”。

这个平台本质上是为AI长期运行设计的专用记忆层。BlueField-4在硬件层面加速数据管理,Spectrum-X以太网提供高速网络,软件栈优化调度机制。

效果立竿见影:特定场景下,每秒处理token数提升最高达5倍。

黄仁勋强调,AI正从“一次性对话的聊天机器人”演进为长期协作的智能体。它们需要理解现实世界、持续推理、调用工具,并保留记忆。这套新架构正是为这一愿景而生。

03 开源战略:英伟达的“生态棋局” 

开源成为今年演讲的又一关键词。英伟达宣布扩展其开源模型生态,覆盖生物医学、物理模拟、Agentic AI、物理AI、机器人和自动驾驶六大领域。

在模型层面,Nemotron系列更新引人注目,涵盖推理、RAG、安全和语音四个方向。企业构建AI客服系统时,可直接使用英伟达开源代码,无需从零训练嵌入模型。

但更具颠覆性的是Alpamayo系列——全球首个面向自动驾驶的开源视觉-语言-行动模型。

Alpamayo的突破在于引入推理能力。传统自动驾驶遵循“感知-规划-控制”流水线,看到红灯就刹车,是规则驱动。而Alpamayo能理解因果关系,预测其他交通参与者意图。

例如在十字路口,它不只识别“前方有车”,而是推理“那辆车可能要左转,所以我应该等待”。这种思维链推理让自动驾驶从“按规则行驶”升级到“像人一样思考”。

英伟达不仅开源模型,还公开了训练数据和工具链,包括仿真框架AlpaSim和超过1700小时的驾驶数据集。这种开放程度在以往是难以想象的。

04 物理AI的“ChatGPT时刻” 

“物理AI的ChatGPT时刻已经到来。”黄仁勋断言,机器开始理解、推理并对现实世界采取行动。

英伟达推出Cosmos模型,这是开源的物理AI世界基础模型。经过海量视频、驾驶数据和3D模拟训练,Cosmos能理解世界运行规律,生成符合物理定律的视频,预测运动轨迹。

机器人领域同样迎来实质性进展。Isaac GROOT N1.6模型专为人形机器人设计,实现全身控制。现场展示的分层舞台上,各类机器人济济一堂,从工业机械臂到家用助手,展现出完整的生态图景。

黄仁勋还带来了一个具体案例:梅赛德斯-奔驰CLA将于2026年在美国上路,搭载L2++级自动驾驶系统。这是英伟达DRIVE系统量产的首个应用。

该系统采用双AI架构:主系统是端到端视觉-语言模型,负责解析传感器和规划路径;安全栈则用严格规则在AI犹豫时接管。这种设计既保证创新性,又确保安全冗余。

05 推理时代:AI基础设施的重构 

纵观整场发布,英伟达的战略意图清晰可见:全力押注推理时代

黄仁勋反复强调,AI正从“生成内容”迈向“持续思考”,从“一次性响应”转向“长期工作”。这一转变需要全新的基础设施支撑。

Rubin平台解决算力问题,推理上下文存储平台突破内存瓶颈,开源模型生态降低应用门槛,物理AI模型打通虚实边界。四位一体,构成英伟达的推理时代解决方案。

行业影响已经开始显现。微软承诺在下一代AI超级工厂部署数十万Vera Rubin芯片,CoreWeave等云服务商将在2026年下半年提供Rubin实例。OpenAI、Anthropic、Meta等AI实验室也计划利用Rubin平台训练更大模型。

在自动驾驶领域,英伟达已与Uber合作开发robotaxi,计划2027年试运营。黄仁勋展望:“未来路上十亿辆车都将自动驾驶,你可以租robotaxi,也可以自己拥有。”

06 变革前夜:AI行业的十字路口 

黄仁勋在演讲中提到一个有趣现象:开源模型整体能力仍比最前沿模型慢约半年,但每隔六个月就会追近一次。像DeepSeek R1这样的开源推理模型,让行业意识到开放协作的扩散速度极快。

这揭示了AI发展的双重轨迹:一方面,巨头们竞相追逐更大参数、更高性能;另一方面,开源模型正快速拉近与前沿技术的距离。

英伟达的布局巧妙兼顾两者:既通过Rubin平台服务最前沿的AI训练需求,又通过开源生态推动技术普及。

随着推理成本下降和开源模型成熟,AI应用将迎来爆发式增长。黄仁勋预测,未来十年,很大一部分汽车将是自动驾驶或高度自动驾驶的。

但挑战依然存在。物理世界复杂性远超虚拟环境,安全性和可靠性要求极高。英伟达通过合成数据、仿真框架和双架构设计应对这些挑战,但真正规模化落地仍需时间验证。

从芯片到模型,从训练到推理,英伟达在CES2026上展示的已不仅是产品迭代,而是对AI发展路径的整体重构。

黄仁勋和他的团队似乎已经看到,AI的未来不再只是追求更大的模型,而是要让智能更经济、更可靠地融入现实世界。

“宇宙中任何存在信息、任何存在结构的地方都可以用来训练人工智能。”黄仁勋在演讲中这样形容AI的潜力。而英伟达,正致力于为这片无限可能构建坚实底座。

随着Rubin平台今年下半年开始交付,自动驾驶模型陆续上车,机器人生态不断扩展,2026年或许真会成为黄仁勋所说的那个转折点——AI从实验室真正走向千行万业的关键一年。

【声明】内容源于网络
0
0
具身涌现
具身涌现是密切关注并报道具身智能技术、智能时代产业和全链路机器人发展的科技创新平台,引领中国具身智能产业发展,推动变革式内容平台。
内容 0
粉丝 0
具身涌现 具身涌现是密切关注并报道具身智能技术、智能时代产业和全链路机器人发展的科技创新平台,引领中国具身智能产业发展,推动变革式内容平台。
总阅读0
粉丝0
内容0