大数跨境
0
0

黄仁勋CES完整实录:英伟达打破规则,Rubin平台芯片六连发,结尾彩蛋似成龙电影

黄仁勋CES完整实录:英伟达打破规则,Rubin平台芯片六连发,结尾彩蛋似成龙电影 科技行者
2026-01-06
7
导读:这就是今天的英伟达。

作者 | 高飞

编辑 | 周周

来源 | 科技行者

2026年1月5日,CES正式开幕前一天,英伟达CEO黄仁勋在拉斯维加斯枫丹白露酒店发表了长达90分钟的主题演讲。3000人挤满主会场,庭院里2000人通过大屏幕观看,四楼原本的展区临时改成了观众区。

虽然CES传统意义上是一个消费电子展,但是AI的到来,让后端业务和前端体验很难再区分。市值4.6万亿美元的英伟达,在2025财年Q3的数据中心业务收入达到512.5亿美元,同比增长66%。黄仁勋演讲所谈及的下一步棋,很多都涉及数据中心。

演讲中有一个细节。英伟达内部有一条规则:任何新一代产品,都不应该有超过一两款芯片的改动。常规迭代时,GPU更新了,其他芯片可以沿用或小改。但Vera Rubin打破了这个规则——Vera CPU、Rubin GPU、NVLink 6 Switch、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-X Ethernet Photonics Switch,六款芯片全部重新设计,投入了15000“工程师年”的工作量。

为什么?黄仁勋给出的解释是:摩尔定律已经放缓,Rubin的晶体管数量只比Blackwell多1.6倍,但我们面临着每年模型增大10倍、生成Token多5倍的压力,如果只是遵循常规的芯片迭代速度,根本不可能跟上。“所以在这一代产品上,我们别无选择,只能把每一块芯片都重新设计一遍。”

这场演讲的背景,是一个正在发生的产业大迁移:过去十年积累的10万亿美元计算基础设施正在被AI重塑,每年两千亿美元的风险投资涌入这个领域,100万亿美元的全球产业研发预算开始转向。“人们问,预算从哪里来?”黄仁勋说,“就是从那里来的。”

计算平台的重塑

黄仁勋将演讲的第一部分,用于描绘一幅产业图景。

每隔1015年,计算机行业就会重置一次即平台级的转变。从大型机到PC,从PC到互联网,从互联网到云,从云到移动时代。每一次平台转移,都意味着开发者会为新的计算平台编写新的应用程序,应用世界都会随着新平台重新构建。

“但这一次,与以往都不同。”黄仁勋停顿了一下,“事实上,我们正在同时经历两场平台级的变革。”

第一场变革是应用层面的,当世界转向AI时,应用程序将建立在AI之上。起初,人们认为AI本身就是一种应用,比如一个聊天机器人或一个图像生成器,这没错,但更重要的是,AI正在成为一个新的平台,未来的应用程序将构建在AI之上

第二场变革,则更彻底:软件的运行方式和开发方式都在被重塑。计算机产业延续了几十年的“五层蛋糕”技术栈(从底层硬件到上层应用)正在被逐一重塑,这就包括:

  • 开发方式的转变:我们不再是“编写”软件(Program the software),而是“训练”软件(Train the software)。
  • 运行平台的转变:软件不再主要运行在CPU上,而是运行在为并行计算而生的GPU上。
  • 交互模式的转变:过去的应用程序是预录制、预编译的,在设备上运行固定的逻辑。而现在的AI应用,能够理解上下文,每一次交互都是从零开始、即时生成每一个像素、每一个Token。

这意味着什么?黄仁勋进一步解释:“计算(Computing)已经被加速计算和人工智能从根本上重塑了。”这场变革的深远影响体现在经济层面。他估算,过去十年全球在传统计算领域积累的约10万亿美元的产业价值,如今都面临着向这种新型计算模式进行“现代化升级”的需求。

那么,钱从哪来?面对这个外界普遍关心的问题,黄仁勋指出,首先,每年数千亿美元的风险投资(VC)正涌入这个领域,用于资助创新和现代化进程。其次,是全球高达百万亿美元体量的各类产业,正在将其研发预算(通常占收入的几个百分点)从传统方法转向人工智能方法。

“人们问钱从哪里来?这就是钱的来源。将传统IT基础设施升级为AI基础设施,将传统研发方法转变为AI驱动的研发方法。巨额的投资正涌入这个行业,这也解释了为什么我们如此忙碌。”

2025年度盘点:五个突破改变游戏规则

在讲了宏观产业背景后,黄仁勋将演讲拉回刚刚过去的2025年,他说这一年“令人难以置信”,仿佛所有重要进展都在同一时间发生。他梳理了推动AI发展的五大关键技术突破,为后续的产品发布构建了基础逻辑

第一个突破:扩展定律(Scaling Laws)持续有效。自2015年BERT模型崭露头角,到2017年Transformer架构的诞生,再到2022年引爆全球的ChatGPT时刻,AI的发展很大程度上遵循一个核心规律:投入越多的计算资源,模型就越智能。黄仁勋特别指出,在ChatGPT发布一年后,一个重要进展发生了——GPT o1作为首个真正意义上的推理模型,引入了“测试时扩展”(Test-time Scaling)的概念。

这使得AI的学习和应用过程被划分为三个阶段,每个阶段都需要巨大的算力,并且扩展定律在每个阶段都持续有效。上图最左侧方框,展示了AI的「智能」水平如何随着「计算」投入的增加而提升。这不是一条线,而是三条:

  • 预训练(Pre-training):模型通过学习海量数据获得基础知识;

  • 后训练(Post-training):通过强化学习(Reinforcement Learning)等技术,让模型学习特定技能,使其行为与人类期望对齐。

  • 测试时扩展(Test-time Scaling):一种更通俗的说法,就是“思考”(Thinking)。在面对一个具体问题时,AI不再是瞬间给出一个答案,而是可以花更多时间进行实时推理,从而得到更优解。

这表明,无论是模型的初始学习、后续微调还是实际应用,更多的计算力都能带来更强的性能,扩展定律依然有效。

第二,AI走向智能体化 (AI BECOMES AGENTIC)智能体的概念从2024年开始出现,并在2025年迅速普及的“智能体系统”(Agentic Systems),标志着AI角色的重大转变。AI不再仅仅是被动回答问题的工具,而是进化为能够主动执行复杂任务的“智能体”。这些智能体模型具备了推理、查阅信息、做研究、使用工具、规划未来、模拟结果的能力。黄仁勋特别提到了Cursor,称“Cursor彻底改变了英伟达内部做软件编程的方式”。

第三,物理AI实现飞跃 (PHYSICAL AI TAKES LEAP)。AI不仅在数字世界发展,也开始与物理世界深度融合。黄仁勋将这种能理解自然法则、与物理世界互动的AI称为「物理AI」。他进一步区分了两个相关但不同的概念:

  • 物理AI(Physical AI):指AI能够与物理世界进行交互,例如控制机器人。

  • AI物理学(AI Physics):指AI能够理解物理世界的规律,例如学习流体力学、材料科学等。

第四,AI学习自然法则 (AI LEARNS LAWS OF NATURE)。这是对“AI物理学”的进一步延伸。AI的应用正在深入基础科学领域,开始学习和理解物理世界的根本规律。

黄仁勋解释说:“宇宙中任何存在信息和结构的地方,我们都可以教一个模型去理解这些信息,理解其表征,并将其转化为AI。”这使得AI能够在生物学、化学、药物研发等领域,通过分析海量数据发现人类难以察觉的模式,加速科学发现。

第五,开源模型达到前沿水平(OPEN MODELS REACH FRONTIER)。这是去年发生的最重要事件之一。开源AI模型的能力正在迅速追赶,甚至在某些方面达到了最顶尖的闭源商业模型的水平。

黄仁勋特别提到了DeepSeek R1,称其为第一个具备推理能力的开源系统,“让世界大吃一惊,并真正激活了整个开源模型领域”。

他指出,尽管开源模型目前仍稳定落后于最前沿的闭源模型大约六个月,但每六个月都会有新的、更智能的开源模型涌现,这极大激发了全球的创新活力:初创公司、大企业、研究人员、学生,乃至每一个国家都希望参与到这场AI革命中。“智能,作为一种数字形式,怎么可能让任何人掉队呢?”他反问道。开源模型的蓬勃发展,使最先进的AI技术不再被少数公司垄断,整个行业生态因此将被重塑。Hugging Face等平台的模型下载量呈爆炸式增长,正是这一趋势的最好证明。

DGX Cloud与开源模型:英伟达的另一面

在梳理了年度五个突破,特别是开源模型的崛起之后,黄仁勋顺势将话题引向了英伟达自身的战略定位和贡献。他透露,英伟达在几年前就已经预见到这一趋势,并开始投入巨资建设和运营自己的AI超级计算机,即DGX Cloud。

“很多人问我们,是不是要进入云计算业务?答案是否定的。”黄仁勋澄清道,“我们建造这些价值数十亿美元的DGX超级计算机,是为了我们自己使用,为了开发我们自己的开源模型。”

他逐一介绍了英伟达的开源模型家族,在各个领域落地。数字生物学方面,La Proteina用于合成和生成蛋白质;OpenFold 3用于理解蛋白质结构;Evo 2用于理解和生成多种蛋白质的相互作用,是构建细胞级表征的开端地球科学方面,Earth 2包含的ForecastNetCorrDiff模型,改变了天气预测的方式;大语言模型方面,NemoTron一个开创性的混合Transformer-SSM(状态空间模型)架构,速度极快,能够进行长时间或非常快速的思考,并产生高质量的回答,黄仁勋预告,近期将发布更多Nemotron-3的变体。世界模型方面,Cosmos能够理解世界是如何运作人形机器人领域还有Groot模型,专注于关节运动、移动性和步态。自动驾驶领域还有Alpamayo,是英伟达在自动驾驶领域的最新成果,后文会详述。

黄仁勋特别强调了英伟达的开放精神不仅限于模型本身。“我们不仅开源模型,还开源我们用来训练这些模型的数据。因为只有这样,你才能真正信任这些模型是如何产生的。”

除了模型和数据,英伟达还推出了一整套库——NeMo库、Physics NeMo库、Clara NeMo库、Bio NeMo库等,这些库是针对特定领域的AI生命周期管理系统,覆盖了从数据处理、数据生成、模型训练、模型创建、评估、护栏设置、一直到最终部署的全流程。老黄坦言,这些库“极其复杂”,但全部都是开源的。

通过这一系列举措,英伟达将自己定位为“一个前沿AI模型的构建者”,并且是以一种完全开放的方式来构建,旨在“赋能每一家公司、每一个行业、每一个国家,让他们都能成为这场AI革命的一部分”。他展示了一张图,显示英伟达在PDF检索、语音识别、语义搜索等多个排行榜上名列前茅。

Agentic AI崛起

在介绍了英伟达的开源模型矩阵后,老黄将焦点集中在当前AI领域的最热潮——智能体AI(Agentic AI)。他认为,这是AI能力的一次根本性飞跃,也是构建未来应用的基本框架。

他首先回顾了ChatGPT刚问世时的普遍观感:结果很有趣,但“幻觉”(Hallucination)问题严重。黄仁勋解释了幻觉的根源:“模型可以记住过去的一切,但它无法记住未来或当前正在发生的事。”因此,AI的回答需要被“锚定”(Grounded)在事实中,在回答问题之前做基础研究

这正是智能体系统(Agentic System)所要解决的核心问题。一个智能体在回答问题之前,会先进行基础研究。它具备一种元认知能力——“推理”(Reasoning)。它会思考:我需要做研究吗?我需要使用工具吗?我如何将问题分解成步骤?每一步,都是AI模型知道如何做的事情,它们能够组合成一系列步骤,执行从未被训练过的任务。

智能体能够将一个它从未被训练过来解决的复杂任务,分解为一系列它已知的、可以执行的子任务,然后将这些步骤组合起来完成最终目标。黄仁勋将此比作人类的能力:“我们遇到一个从未见过的情况,并将其分解为我们过去经历过的且懂得如何处理的子情境、知识和规则。”黄仁勋解释道,这就是推理的奇妙能力,强化学习、思维链、搜索、规划等技术的结合,使得这种基础的推理能力成为可能,并且这些技术现在也已完全开源。

紧接着,黄仁勋分享了一个让他觉得“完全是天才”的突破性想法——多模型架构这个想法的灵感来自于AI搜索公司Perplexity创始人Aravind Srinivas。他第一次见到Perplexity在同时使用多个模型来解决问题时,深受启发。“当然了,我们人类会这么做,一个AI当然也应该能够调用世界上所有伟大的AI来解决它在推理链中任何一个环节遇到的问题。”

基于这一洞察,黄仁勋提到未来AI应用的宏观架构,这个架构具备几个关键特征:

  • 多模态(Multi-modal):AI能够理解语音、图像、文本、视频、3D图形、蛋白质结构等多种类型的信息。
  • 多模型(Multi-model):AI能够根据任务的具体需求,调用最适合该任务的模型。
  • 多云(Multi-cloud):由于这些不同的AI模型可能部署在世界各地的不同云服务上,因此这种架构天然就是多云的。
  • 混合云(Hybrid-cloud):对于企业、机器人或边缘设备(如蜂窝基站、医院)等需要数据实时处理和隐私保护的场景,模型可以部署在本地。

这个由智能体驱动的,集多模态、多模型、多云/混合云于一体的框架,不仅为AI初创公司注入了强大的动力,也让企业能够定制化自己的AI。黄仁勋解释道:“你可以教你的AI一些别人没有教过的技能,让你的AI在某个特定领域变得智能。这正是我们通过Nemotron、Nemo和所有开源模型想要实现的目标。”

为了让大家理解这个抽象的框架,黄仁勋现场播放了一段演示视频:如何快速构建个人的AI助理。

视频中,一位开发者展示了如何利用这个框架,将一个名为“Reachy”的迷你机器人(由Hugging Face提供)变成一个功能强大的个人助理。这是该智能体的工作原理:

1、设定目标:开发者希望助理能帮他处理日历、邮件、待办事项,甚至照看家里。

2、本地化与隐私:他使用Brev工具将自己的DGX Spark(一台小型AI工作站)变成个人云。为了保护邮件隐私,他部署了一个在本地Spark上运行的开源模型。

3、智能路由:他设置了一个基于“意图”(Intent-based)的模型路由器。这个路由器就像一个管理者,当用户的指令(Prompt)涉及到邮件时,它会自动将任务分配给本地运行的开源模型处理;而其他通用任务,则可以调用外部更强大的前沿模型API。

4、连接物理世界:他将智能体与Reachy机器人的头部、耳朵和摄像头连接起来,通过工具调用(Tool Calls)来控制机器人。

5、赋予声音:他接入了11 Labs的API,让机器人拥有了自然流畅的语音。

演示中,这个名为Reachy的AI助理展现了惊人的能力:

  • 查询信息。开发者问:“今天我的待办事项是什么?” Reachy回答:“买菜(鸡蛋、牛奶、黄油),以及把新脚本发给黄仁勋。”
  • 执行任务。开发者说:“好的,给Jensen发个更新,告诉他我们今天之内会搞定。” Reachy回应:“没问题。”
  • 多模态创作。开发者问:“这里有张草图,能把它变成建筑效果图吗?” Reachy迅速生成了一张精美的效果图,接着它还能根据指令生成一段展示房间的视频。
  • 远程协作与环境交互。开发者将Reachy的访问权限分享给了同事Anna。Anna远程问:“Potato(一只狗的名字)在干嘛?” Reachy通过摄像头看到狗在沙发上,并结合它记住的主人喜好,主动对狗发出指令:“Potato在沙发上。我记得你不喜欢这样,我会让它下去。Potato,下沙发!”

黄仁勋总结说,这个结合了前沿闭源模型和本地定制化模型的智能体框架,能够连接工具、文件甚至其他智能体,正是现代AI应用的基本架构。

更重要的是,这套框架正在被深度集成到企业平台中,例如:Palantir的整个AI和数据处理平台正在被英伟达加速;ServiceNow,世界领先的客户服务和员工服务平台;Snowflake,云端世界顶级数据平台;CodeRabbit,英伟达内部各处都在使用;CrowdStrike,创建AI来检测AI威胁;NetApp的数据平台现在有英伟达语义AIAgentic系统用于客户服务。

黄仁勋强调,未来Agentic系统就是交互界面。这些交互界面不再是传统的Excel表格或命令行,而是像与人交谈一样自然、多模态的智能体界面。你与平台互动的方式更加简单,就像你在与人互动一样。"

物理AI的实现路径

从数字世界的智能体,黄仁勋将话题过渡到他最关注的领域之一:物理AI(Physical AI),他坦言英伟达已经投入物理AI八年之久。

核心问题是:如何让一个存在于计算机内部、通过屏幕和扬声器与人交互的智能,真正走向物理世界,理解并与之互动?

这意味着AI必须理解物理世界运作的“常识”:物体恒存性(Object Permanence):如果看向别处,再移回视线,那个物体依然在那里。因果关系(Causality):如果推一个东西,它会倒下。物理规律:AI需要理解摩擦力、重力、惯性,它要知道,一辆重型卡车需要更长的刹车距离,一个球会持续滚动。

这些对一个小孩来说都是常识,但对AI而言却是完全未知的。为了教会AI这些,英伟达构建了一个独特的系统,这个系统需要三种不同的计算机协同工作:

一台计算机用于训练AI模型,这是英伟达的传统强项;一台计算机用于推理,即机器人计算机,运行在汽车、机器人、工厂等边缘设备中,执行模型的推理;还有一台是仿真计算机,这是实现物理AI的基础,黄仁勋强调,“「仿真(Simulation)」是英伟达几乎所有工作的核心。”AI如何知道它执行的动作是否正确?它必须能够在一个虚拟环境中模拟物理世界对它动作的反馈。没有仿真,就无法评估AI的行为,因为现实世界的每一次互动都是不可复现的。

基于这“三大计算机”,英伟达构建了相应的软件栈:

  • Omniverse:一个基于物理的、用于创建数字孪生(Digital Twin)的仿真世界。
  • Cosmos:一个世界基础模型(World Foundation Model)。它不是语言模型,而是关于世界如何运作的模型,并且能与语言对齐。你可以问它“那个球怎么样了?”,它会告诉你“球正在街上滚动”。
  • 机器人模型:包括用于人形机器人的Groot和用于自动驾驶的Alpaca。

在物理AI的训练中,一个巨大的挑战是数据从何而来。语言模型可以从海量的文本中学习,但如何教AI物理世界的“基准真相”(Ground Truth)?现实世界的视频虽然很多,但远不足以覆盖所需的多样性和交互类型。

“这就是伟大思想汇聚的地方,”黄仁勋说,“我们将‘计算’转化为了‘数据’。”

这个核心思想就是合成数据生成(Synthetic Data Generation)通过使用基于物理定律和基准真相约束的仿真环境,可以有选择地、巧妙

【声明】内容源于网络
0
0
科技行者
科技行者,至顶科技旗下的创新生态媒体,多年来一直站在科技的最前沿,致力于与打造“更深刻的创新“和“更硬核的科技”的创业者、企业家对话,连接产品与市场,项目与资本让创新更有价值。
内容 1229
粉丝 0
科技行者 北京第二十六维信息技术有限公司 科技行者,至顶科技旗下的创新生态媒体,多年来一直站在科技的最前沿,致力于与打造“更深刻的创新“和“更硬核的科技”的创业者、企业家对话,连接产品与市场,项目与资本让创新更有价值。
总阅读9.8k
粉丝0
内容1.2k