黄仁勋CES2026演讲：AI推理成本暴降10倍，自动驾驶迎来“ChatGPT时刻”- 大数跨境

首页

黄仁勋CES2026演讲：AI推理成本暴降10倍，自动驾驶迎来“ChatGPT时刻”

具身涌现

2026-01-06

导读：CES，英伟达CEO黄仁勋再次身着标志性皮衣登台。与往年不同，这次他带来的不是单一产品，而是一套完整的AI推理时代基础设施解决方案。“每隔10到15年，计算行业就会革新一次。”黄仁勋开场便定下基调。幻

皮衣刀客又亮剑，从芯片到模型的全栈革命正在开启AI新纪元。

拉斯维加斯CES2026现场，英伟达CEO黄仁勋再次身着标志性皮衣登台。与往年不同，这次他带来的不是单一产品，而是一套完整的AI推理时代基础设施解决方案。

“每隔10到15年，计算行业就会革新一次。”黄仁勋开场便定下基调。他身后幻灯片赫然写着：“人工智能的发展超越了大型语言模型。”

这场演讲不仅发布了新一代Rubin GPU平台，更有面向自动驾驶的开源模型Alpamayo、物理AI世界模型Cosmos，以及机器人基础模型GROOT更新。英伟达正从硬件到软件，从训练到推理，全面布局下一代AI生态。

01 Rubin平台：推理成本的“价格杀手”

黄仁勋展示的第一张性能对比图就引起轰动：全新Rubin GPU平台的推理token成本比Blackwell降低高达10倍。

具体来看，Rubin GPU的NVFP4推理算力达到50PFLOPS，是Blackwell的5倍；训练性能提升至35PFLOPS，增长3.5倍；HBM4内存带宽22TB/s，是前代的2.8倍。

但性能提升只是表象，Rubin架构的真正突破在于其协同设计理念。

六款新品——Vera CPU、Rubin GPU、NVLink 6 Switch、ConnectX-9 SuperNIC、BlueField-4 DPU和Spectrum-6 Ethernet Switch——被极致优化，共同构建了一台划时代的AI超算系统。

黄仁勋引入了一个关键概念：Test-time Scaling（推理时扩展）。简单来说，就是让AI“遇到问题时多想一会儿”。

传统AI能力提升依赖训练阶段投入更多算力，把模型越做越大。而现在，即使模型规模不变，只要在推理时给予更多计算资源，性能也能显著提升。

Rubin平台的核心使命就是让“AI多想一会儿”变得经济可行。NVL72机架级解决方案集成72个Rubin GPU，通过NVLink 6实现260TB/s的总带宽，“比整个互联网的带宽还多”。

02 破解存储瓶颈：推理上下文内存存储平台

当AI进行多轮对话和复杂推理时，会产生海量上下文数据。传统架构要么占用昂贵GPU内存，要么存入访问缓慢的普通存储，形成“存储瓶颈”。

英伟达此次推出了由BlueField-4驱动的推理上下文内存存储平台，在GPU内存和传统存储间创建了“第三层”。

这个平台本质上是为AI长期运行设计的专用记忆层。BlueField-4在硬件层面加速数据管理，Spectrum-X以太网提供高速网络，软件栈优化调度机制。

效果立竿见影：特定场景下，每秒处理token数提升最高达5倍。

黄仁勋强调，AI正从“一次性对话的聊天机器人”演进为长期协作的智能体。它们需要理解现实世界、持续推理、调用工具，并保留记忆。这套新架构正是为这一愿景而生。

03 开源战略：英伟达的“生态棋局”

开源成为今年演讲的又一关键词。英伟达宣布扩展其开源模型生态，覆盖生物医学、物理模拟、Agentic AI、物理AI、机器人和自动驾驶六大领域。

在模型层面，Nemotron系列更新引人注目，涵盖推理、RAG、安全和语音四个方向。企业构建AI客服系统时，可直接使用英伟达开源代码，无需从零训练嵌入模型。

但更具颠覆性的是Alpamayo系列——全球首个面向自动驾驶的开源视觉-语言-行动模型。

Alpamayo的突破在于引入推理能力。传统自动驾驶遵循“感知-规划-控制”流水线，看到红灯就刹车，是规则驱动。而Alpamayo能理解因果关系，预测其他交通参与者意图。

例如在十字路口，它不只识别“前方有车”，而是推理“那辆车可能要左转，所以我应该等待”。这种思维链推理让自动驾驶从“按规则行驶”升级到“像人一样思考”。

英伟达不仅开源模型，还公开了训练数据和工具链，包括仿真框架AlpaSim和超过1700小时的驾驶数据集。这种开放程度在以往是难以想象的。

04 物理AI的“ChatGPT时刻”

“物理AI的ChatGPT时刻已经到来。”黄仁勋断言，机器开始理解、推理并对现实世界采取行动。

英伟达推出Cosmos模型，这是开源的物理AI世界基础模型。经过海量视频、驾驶数据和3D模拟训练，Cosmos能理解世界运行规律，生成符合物理定律的视频，预测运动轨迹。

机器人领域同样迎来实质性进展。Isaac GROOT N1.6模型专为人形机器人设计，实现全身控制。现场展示的分层舞台上，各类机器人济济一堂，从工业机械臂到家用助手，展现出完整的生态图景。

黄仁勋还带来了一个具体案例：梅赛德斯-奔驰CLA将于2026年在美国上路，搭载L2++级自动驾驶系统。这是英伟达DRIVE系统量产的首个应用。

该系统采用双AI架构：主系统是端到端视觉-语言模型，负责解析传感器和规划路径；安全栈则用严格规则在AI犹豫时接管。这种设计既保证创新性，又确保安全冗余。

05 推理时代：AI基础设施的重构

纵观整场发布，英伟达的战略意图清晰可见：全力押注推理时代。

黄仁勋反复强调，AI正从“生成内容”迈向“持续思考”，从“一次性响应”转向“长期工作”。这一转变需要全新的基础设施支撑。

Rubin平台解决算力问题，推理上下文存储平台突破内存瓶颈，开源模型生态降低应用门槛，物理AI模型打通虚实边界。四位一体，构成英伟达的推理时代解决方案。

行业影响已经开始显现。微软承诺在下一代AI超级工厂部署数十万Vera Rubin芯片，CoreWeave等云服务商将在2026年下半年提供Rubin实例。OpenAI、Anthropic、Meta等AI实验室也计划利用Rubin平台训练更大模型。

在自动驾驶领域，英伟达已与Uber合作开发robotaxi，计划2027年试运营。黄仁勋展望：“未来路上十亿辆车都将自动驾驶，你可以租robotaxi，也可以自己拥有。”

06 变革前夜：AI行业的十字路口

黄仁勋在演讲中提到一个有趣现象：开源模型整体能力仍比最前沿模型慢约半年，但每隔六个月就会追近一次。像DeepSeek R1这样的开源推理模型，让行业意识到开放协作的扩散速度极快。

这揭示了AI发展的双重轨迹：一方面，巨头们竞相追逐更大参数、更高性能；另一方面，开源模型正快速拉近与前沿技术的距离。

英伟达的布局巧妙兼顾两者：既通过Rubin平台服务最前沿的AI训练需求，又通过开源生态推动技术普及。

随着推理成本下降和开源模型成熟，AI应用将迎来爆发式增长。黄仁勋预测，未来十年，很大一部分汽车将是自动驾驶或高度自动驾驶的。

但挑战依然存在。物理世界复杂性远超虚拟环境，安全性和可靠性要求极高。英伟达通过合成数据、仿真框架和双架构设计应对这些挑战，但真正规模化落地仍需时间验证。

从芯片到模型，从训练到推理，英伟达在CES2026上展示的已不仅是产品迭代，而是对AI发展路径的整体重构。

黄仁勋和他的团队似乎已经看到，AI的未来不再只是追求更大的模型，而是要让智能更经济、更可靠地融入现实世界。

“宇宙中任何存在信息、任何存在结构的地方都可以用来训练人工智能。”黄仁勋在演讲中这样形容AI的潜力。而英伟达，正致力于为这片无限可能构建坚实底座。

随着Rubin平台今年下半年开始交付，自动驾驶模型陆续上车，机器人生态不断扩展，2026年或许真会成为黄仁勋所说的那个转折点——AI从实验室真正走向千行万业的关键一年。

【声明】内容源于网络

具身涌现

具身涌现是密切关注并报道具身智能技术、智能时代产业和全链路机器人发展的科技创新平台，引领中国具身智能产业发展，推动变革式内容平台。

内容 0

粉丝 0

具身涌现具身涌现是密切关注并报道具身智能技术、智能时代产业和全链路机器人发展的科技创新平台，引领中国具身智能产业发展，推动变革式内容平台。

总阅读0

粉丝0

内容0