大数跨境
0
0

黄仁勋CES2026最新演讲:这不是显卡,是一座2吨重的AI工厂

黄仁勋CES2026最新演讲:这不是显卡,是一座2吨重的AI工厂 报告研究所
2026-01-06
7

【导读】美东时间1月5日,英伟达在CES 2026正式发布新一代Rubin AI平台及多项开源AI技术,标志着其在AI基础设施与物理AI两大方向同步加速推进。

英伟达发布Rubin AI平台,性能提升5倍,已全面投产

美东时间1月5日周一,英伟达CEO黄仁勋在拉斯维加斯CES展会宣布,新一代Rubin AI平台正式推出并已全面投产。该平台由六款全新芯片组成,整机重量近2吨,被称作“真正的人工智能工厂”,可实现每秒千亿级AI运算。

性能跃升:训练快3.5倍,推理成本降10倍

Rubin平台训练性能为前代Blackwell的3.5倍,AI软件运行性能提升5倍;推理token生成成本最高可降低10倍,训练混合专家模型(MoE)所需GPU数量减少4倍。

Vera CPU搭载88个定制Olympus核心,专为代理推理设计,能效为同级别产品两倍;Rubin GPU集成第三代Transformer引擎,支持硬件加速自适应压缩,单卡提供50 petaflops NVFP4算力与3.6TB/s带宽;Vera Rubin NVL72机架级系统总带宽达260TB/s。

芯片进展顺利,生态伙伴加速落地

全部六款Rubin芯片已从制造合作伙伴回厂,并通过关键部署测试。平台集成五大核心技术:第六代NVLink互连、Transformer引擎、机密计算、RAS引擎与Vera CPU。其中,第三代机密计算技术首次实现CPU、GPU与NVLink域全链路数据安全保护;第二代RAS引擎支持实时健康监测与主动维护,模块化无线缆托盘设计使组装与维护效率较Blackwell提升18倍。

微软、AWS、谷歌云、甲骨文云、CoreWeave、Lambda、Nebius和Nscale等云服务商将在2026年首批部署Rubin实例。微软下一代Fairwater AI超级工厂将采用Vera Rubin NVL72系统,规模可扩展至数十万颗超级芯片。

OpenAI CEO Sam Altman评价:“英伟达Rubin平台帮助我们持续扩展智能边界。” Anthropic CEO Dario Amodei指出,其效率提升“代表了更长记忆、更好推理与更可靠输出所需的基础设施进步”。Meta CEO扎克伯格称,该平台有望带来“性能与效率的阶跃式变化”,是面向十亿级用户部署最先进模型的关键基础。

思科、戴尔、惠普企业、联想、超微将陆续推出Rubin服务器;Anthropic、Cohere、Meta、Mistral AI、OpenAI、xAI等AI实验室正规划基于Rubin训练更大、更强的模型。

首发开源推理VLA模型Alpamayo 1,推动自动驾驶进入“思考”时代

英伟达同步开源首个推理视觉-语言-动作(VLA)模型Alpamayo 1,采用100亿参数架构,支持视频输入,可生成驾驶轨迹及完整推理过程,旨在打造能在突发状况下自主“思考”解决方案的车辆系统。

首款搭载英伟达技术的汽车将于2026年第一季度在美国上路,第二季度在欧洲上路,下半年在亚洲上路。

构建开放自动驾驶开发生态

Alpamayo家族包含三大支柱:开源模型、仿真框架AlpaSim与大规模真实驾驶数据集(超1700小时,覆盖全球复杂边缘场景),已在Hugging Face与GitHub开源发布。

AlpaSim是端到端高保真自动驾驶仿真框架,支持真实传感器建模、动态交通配置与闭环测试;数据集涵盖罕见事故、信号灯故障等典型长尾问题,为推理能力训练提供关键支撑。

英伟达强调,Alpamayo 1作为教师模型,不直接部署于车端,而是用于微调和蒸馏至车载系统骨干中。后续版本将扩展参数规模、增强推理深度、提升多模态灵活性,并开放商业授权选项。

推理VLA技术原理:让AI像人一样分步决策

推理VLA融合视觉感知、语言理解与动作生成,区别于传统VLA模型的是——它能将复杂任务分解为子步骤,并以可解释形式呈现推理链条。例如在十字路口场景:“看到停止标志+左侧来车+行人过马路→减速停车→等待行人通过→安全通行”。

该能力依赖三类基础功能协同:视觉感知(处理摄像头、激光雷达等传感器数据)、语言理解(解析指令与上下文提示)、动作与决策制定(融合多源信息生成可执行指令与推理痕迹)。

跨行业AI模型全面开源,覆盖代理AI、物理AI、机器人与生物医学

英伟达本周同步发布多个领域开源模型与工具

  • Nemotron家族:面向代理AI,新增语音识别(Nemotron Speech)、多模态检索增强生成(Nemotron RAG)及安全增强模型,支持低延迟实时字幕与多语言多模态洞察;
  • Cosmos平台:面向物理AI,提供类人推理与开放世界生成能力;
  • Isaac GR00T N1.6:面向人形机器人,集成全身控制与Cosmos Reason推理引擎;
  • Clara平台:面向生物医学,支持蛋白质结构预测与多组学分析。

配套发布全球最大的开放多模态数据集之一:10万亿语言训练标记、50万个机器人轨迹、45.5万个蛋白质结构、100TB车辆传感器数据。所有模型、数据与训练框架已在GitHub、Hugging Face及build.nvidia.com开放获取,并支持通过NVIDIA NIM微服务,在边缘至云端任意NVIDIA加速基础设施上安全、可扩展部署。

博世、CodeRabbit、CrowdStrike、Fortinet、Franka Robotics、Palantir、Salesforce、ServiceNow、日立、Uber等企业已启动基于上述开源技术的联合开发。

【声明】内容源于网络
0
0
报告研究所
各类跨境出海行业相关资讯
内容 3469
粉丝 1
报告研究所 各类跨境出海行业相关资讯
总阅读118.7k
粉丝1
内容3.5k