大数跨境
0
0

算力之巅,智造未来:黄仁勋GTC 2025核心洞察——AI算力、推理经济与未来工厂的投资逻辑

算力之巅,智造未来:黄仁勋GTC 2025核心洞察——AI算力、推理经济与未来工厂的投资逻辑 华尔街俱乐部
2025-06-20
2
导读:此次演讲不仅展示了NVIDIA在AI领域的最新技术突破,更揭示了AI工厂作为全新计算范式的巨大商业潜力和投资机遇,这对于金融行业从业者和专家学者深入理解未来科技趋势和把握市场先机至关重要。


在2025年的NVIDIA GTC大会上,NVIDIA创始人兼首席执行官黄仁勋为全球描绘了一幅由人工智能驱动的未来图景,强调了算力作为数字经济基石的革命性作用。此次演讲不仅展示了NVIDIA在AI领域的最新技术突破,更揭示了AI工厂作为全新计算范式的巨大商业潜力和投资机遇,这对于金融行业从业者和专家学者深入理解未来科技趋势和把握市场先机至关重要。

AI新浪潮:从感知到智能体与物理AI

人工智能的发展正经历着从感知智能到更高阶智能的演进,这深刻地改变了计算的本质,并对算力提出了前所未有的需求。

  • 感知AI与生成式AI的崛起:大约十年前,人工智能开始进入大众视野,最初聚焦于感知AI,如计算机视觉和语音识别。近五年来,焦点转向了生成式AI,它能够将一种模态转化为另一种模态,例如文本到图像、图像到文本、文本到视频,甚至氨基酸到蛋白质或属性到化学品。生成式AI从根本上改变了计算方式,从过去基于检索的计算模式转变为基于生成的计算模式。AI现在能理解上下文和请求的含义,并直接生成答案,而非仅仅检索预存数据。

  • 智能体AI的重大突破:过去两三年见证了人工智能领域的重大突破——智能体AI。智能体AI具备“能动性”,能够感知和理解环境上下文,并最重要的是具备“推理”能力,能够对如何回答问题或解决问题进行推理,并规划和执行行动。它们还能利用多模态信息使用工具,例如访问网站获取信息并将其用于任务。推理是智能体AI的核心。

  • 物理AI的崭露头角:下一波AI浪潮是“物理AI”,它理解物理世界,包括摩擦、惯性、因果关系、物体永恒性等。物理AI将赋能机器人技术,预示着AI应用将无处不在,从云端走向世界的每个角落。

这些AI新阶段的演进,为所有参与者带来了前所未有的市场机遇,使得GTC大会的规模每年都在扩大,如同“AI的超级碗”,且每个参与者都能从中获益。

Blackwell架构:算力引擎的革命性飞跃

作为AI时代承载算力的关键基础设施,智算中心正迎来高速建设周期。NVIDIA的Blackwell架构正是为了满足AI超高速发展对计算能力和能效的极致需求而生,代表了算力引擎的革命性飞跃。

  • 从HGX到Blackwell NVLink 72:上一代系统架构HGX已经彻底改变了计算和人工智能领域,它将八颗GPU(每个GPU包含两个Blackwell芯片)通过NVLink 8连接,再通过PCIe连接到CPU,并通过Infiniband构建成AI超级计算机。然而,NVIDIA的目标是进一步扩展规模。Blackwell架构实现了根本性的计算机架构转型,其核心在于NVLink 72机架,它通过解耦NVLink交换机并将其置于机箱中央,实现了计算节点的高度密集化。整个系统采用液冷技术,使得所有计算节点能够压缩到一个机架内,将过去由6万个组件组成的计算机转变为一个机架内包含60万个组件的120千瓦全液冷系统。

  • 极致的纵向扩展能力:Blackwell NVLink 72机架实现了世界前所未有的极致纵向扩展(Scale-up)。它拥有惊人的130万亿个晶体管(其中20万亿用于计算),提供570太字节/秒的内存带宽,并在单个机架内实现了1 Exaflops(百万兆次浮点运算每秒)的计算能力。黄仁勋强调,Blackwell在相同功耗(ISO power)下比Hopper性能提升了25倍,这是摩尔定律的终极体现,因为数据中心的核心限制因素是功耗,这直接影响到数据中心的营收。

  • Blackwell系列路线图

    • Blackwell Ultra:预计在2024年下半年推出,提供1.5倍的浮点运算能力和2倍的网络带宽,特别适用于KV缓存等对内存带宽要求高的应用。

    • Vera Rubin:作为下一个重要里程碑,将于2025年下半年发布。它将配备全新的CPU(性能是Grace的两倍,功耗仅50瓦),全新的GPU,CX9智能网卡,全新的NVLink 6,以及HBM4内存。

    • Rubin Ultra:定于2027年下半年,将实现前所未有的MVLink 576极致纵向扩展,每个机架功耗达600千瓦,包含250万个部件,提供15 Exaflops的计算能力(Blackwell的14倍),以及4.6 PB/s的纵向扩展带宽。 这些年度发布节奏,旨在为AI工厂的长期规划和投资提供清晰的路线图,避免意外,确保AI基础设施建设的稳定性和前瞻性。

推理:AI工作负载的核心与价值重塑

黄仁勋指出,推理(Inference)是未来AI工作负载的终极极端计算问题,其效率直接关系到AI工厂的营收和盈利能力。

  • 推理的复杂性与计算需求:过去人们普遍认为推理相对简单,但现在看来恰恰相反。AI生成的是“令牌(tokens)”,这些令牌被重构为单词。智能的AI需要生成大量的推理令牌、一致性检查令牌以及用于选择最佳方案的令牌。这意味着AI在思考过程中会“自言自语”,生成多步的推理序列。这种“思维链(chain of thought)”技术导致生成的令牌数量轻松超过100倍,从而对计算能力提出了巨大挑战。

  • 速度与吞吐量的权衡:在AI工厂中,存在延迟(用户响应时间)和吞吐量(工厂每秒生成的令牌数量)之间的根本性矛盾。客户希望AI能够快速响应,但同时工厂也需要最大化令牌产量以提高营收。理想情况是实现“单位用户每秒令牌数”和“工厂每秒令牌数”的双重最大化,即在工厂能力范围内,为每个用户提供最快的令牌生成速度。

  • 推理的两个阶段:预填充与解码

    • 预填充(Prefill):这是AI“思考”的阶段,例如阅读大量信息(PDF、网站、视频),并将其消化以形成答案。这个阶段对浮点运算(flops)需求巨大,但令牌产出相对较少。

    • 解码(Decode):这是AI实际生成令牌的阶段,例如与聊天机器人互动。这个阶段对带宽需求巨大,因为每次生成一个令牌都需要从HBM内存中提取整个模型(数万亿参数),并结合KV缓存。

  • Blackwell在推理中的优势:Blackwell架构,特别是结合了FP4精度的NVLink 72和Dynamo操作系统,对于推理工作负载表现出卓越性能。在处理推理模型时,Blackwell比Hopper的性能高出40倍。这意味着在同等功耗下,Blackwell能带来惊人的效率提升,大幅降低AI服务的成本,并提高AI工厂的营收潜力。

NVIDIA的AI加速生态系统:CUDA-X、Omniverse与Dynamo

NVIDIA不仅提供强大的AI芯片,更构建了一个完整的全栈(full stack)AI生态系统,从底层硬件到软件库、平台和操作系统,全面加速AI的开发、训练和部署。

  • CUDA-X库

    • CUDA的基石作用:CUDA自2006年以来,已拥有超过600万开发者,遍布200多个国家,彻底改变了计算领域。它使得加速计算成为可能,NVIDIA提供的900多个CUDA-X库,覆盖了科学、物理、生物、多物理场、量子物理等诸多领域。

    • 核心加速库

      • CuNumeric:为Python最常用的NumPy库提供零代码修改的GPU加速。

      • CuLitho:计算光刻库,未来所有光刻掩模将在NVIDIA CUDA上处理。

      • Aerial:将GPU转化为5G无线电的库,将AI注入无线电网络,以应对信息理论的限制。

      • CuOpt:用于数学优化的库,能将数小时的复杂规划问题缩短至数秒,并即将开源,将加速供应链管理等多个行业。

      • Parabricks:用于基因测序和分析。

      • Monai:全球领先的医学影像库。

      • Earth-2:用于高分辨率预测局部天气。

      • CuQuantumCUDA Q:支持量子架构和算法研究,以及经典的加速量子异构架构。

      • QDSQDF:分别用于CAE的稀疏求解器和结构化数据(如Spark和Pandas)的GPU加速。

      • Warp:一个用于CUDA的Python物理库。

    • 这些库的广泛应用和CUDA庞大的安装基础,确保了开发者能够利用NVIDIA的加速计算能力,使其软件能够触达更广泛的用户。

  • Omniverse平台

    • AI工厂的数字孪生:Omniverse是NVIDIA用于物理AI的操作系统。它作为AI工厂的蓝图,支持在物理建设开始之前进行设计和优化。NVIDIA工程师利用Omniverse蓝图规划千兆瓦级AI工厂,整合DGX SuperPODs的3D布局数据、Vertiv和施耐德电气的先进电源与冷却系统,以及NVIDIA Air的网络拓扑。

    • 实时仿真与协同:Omniverse通过实时仿真,将原本孤立的设计工作流整合,使工程团队能够并行协作,快速迭代并运行大规模的“假设分析”,从而最大化总拥有成本(TCO)并提高电源使用效率。

    • 自动驾驶与机器人训练:Omniverse和Cosmos结合,将日志数据转化为3D场景,进行基于物理的闭环训练和合成数据生成,大大增强了自动驾驶汽车在复杂场景下的适应性。在机器人领域,Omniverse通过Cosmos生成无限、受控的虚拟环境来创建训练数据,并利用物理定律作为可验证的奖励机制,加速AI模型的学习。

  • Dynamo操作系统

    • AI工厂的“操作系统”:Dynamo被NVIDIA称为AI工厂的操作系统,它负责管理AI计算的极度复杂性,包括流水线并行、张量并行、专家并行、即时批处理、解耦推理工作负载管理,以及KV缓存路由和内存层级管理。

    • 开放与合作:Dynamo是开源的,NVIDIA正与Perplexity等合作伙伴共同开发,旨在实现AI工作负载的动态操作和优化。

    • “工业革命”的象征:Dynamo的名字来源于引发第一次工业革命的发电机,象征着其在AI工业革命中的核心地位。它能够进一步提升Blackwell架构的性能曲线,尤其在平衡用户体验和工厂吞吐量方面发挥关键作用。

  • 互联与存储基础设施

    • 网络扩展:NVIDIA通过Infiniband和Spectrum-X技术实现AI超算系统的横向扩展(Scale-out)。NVIDIA与思科合作,将Spectrum-X集成到企业产品线中,帮助全球企业转型为AI公司。

    • 硅光子技术:NVIDIA推出了其首款共封装光学硅光子系统(1.6太比特/秒CPO),这项“疯狂”的技术通过微环谐振器调制器实现了显著的能效提升。相较于传统收发器,它能节省数十兆瓦的功耗,这对于扩展到数十万甚至数百万GPU的AI工厂至关重要,因为能耗直接限制了营收。

AI在多行业的深远影响与应用

人工智能不再局限于科研实验室,正深度融入各个行业,驱动着前所未有的变革。

  • 自动驾驶:NVIDIA在自动驾驶领域深耕十余年,提供从数据中心(如特斯拉使用NVIDIA GPU)到车载计算机(如Waymo和Wave)的全套技术和软件栈。通用汽车(GM)已选择NVIDIA作为其未来自动驾驶车队开发的合作伙伴。NVIDIA还高度重视汽车安全(Halos),其700万行代码经过第三方安全评估,拥有千余项专利,确保自动驾驶汽车的安全性和可靠性。通过Omniverse平台,NVIDIA利用模型蒸馏、闭环训练和合成数据生成等新方法,加速自动驾驶AI的开发。

  • 机器人技术:面对全球劳动力短缺问题,机器人技术将成为一个巨大的产业。物理AI将赋予各类机器人自主能力。训练机器人需要海量的数据,而NVIDIA的Isaac Lab和Omniverse平台能够通过合成数据生成和学习模拟环境来解决数据难题。例如,富士康在虚拟的NVIDIA Blackwell生产设施中测试异构机器人集群的Mega方案。NVIDIA还发布了Isaac Groot N1,这是一款为人形机器人设计的通用基础模型,采用快慢思考双系统架构,并已开源,加速人形机器人的开发和部署。与DeepMind和迪士尼研究合作的Newton物理引擎,能够进行超实时、精细的刚体和软体仿真,为机器人训练提供物理层面的可验证奖励,极大提升了机器人学习效率。智能制造本身也通过机器人技术的广泛应用,显著提高了生产效率,减少了非计划停机时间和库存。

  • 企业计算:AI正向企业IT、制造业等领域全面渗透。NVIDIA推出了一系列针对企业AI需求的新型计算机:

    • DGX Spark:作为新型个人开发平台,它将原DGX-1(20个CPU核心、128GB GPU内存、1 Petaflops计算能力、15万美元、3500瓦功耗)的性能集成到更小、更高效的设备中,成为软件工程师和AI研究人员的首选开发工具。

    • DGX Station:这是一款液冷个人工作站,集成了Grace Blackwell架构,提供20 Petaflops计算能力、72个CPU核心和HBM内存,并支持GeForce显卡。这些新产品将由惠普、戴尔、联想、华硕等OEM厂商提供。

    • 存储革命:未来的企业存储将不再是传统的检索式存储系统,而是语义化检索系统,能够持续将原始数据嵌入知识,并通过AI代理进行问答式访问,实现GPU加速。戴尔等全球领先的存储供应商将提供基于NVIDIA技术的新一代存储系统。

    • NIMS(NVIDIA Inference Microservices):NIMS是可下载并在任何地方(DGX Spark、DGX Station、服务器、云端)运行的开源AI模型,能无缝集成到各种智能体AI框架中。NVIDIA已与埃森哲、Amdocs、AT&T、贝莱德、Cadence、Capital One、德勤、安永、纳斯达克、SAP、ServiceNow等众多行业巨头合作,共同构建AI框架和AI工厂。

  • 工业互联网与智能工厂:工业互联网平台作为工业4.0和“智能工厂”计划的核心组成部分,正成为驱动制造业数字化转型的关键引擎。

    • 平台特性:它扮演着新型工业体系的“操作系统”角色,能够将传统制造业中工匠的隐性经验和工艺知识模型化、软件化,并形成多层次、松散耦合的结构,服务于“千企千面”的异质性需求。

    • 六大模式的突破

      • 平台化设计:打破资源分散困境,整合人才和工具,实现跨行业、跨领域、跨组织的协同研发,赋能中小企业数字化转型。

      • 智能化生产:通过智能设备和产线建设,提升生产效率,降低故障率和库存,并能将隐性工业知识显性化、软件化。

      • 网络化协同:打通企业内外部信息孤岛和数据壁垒,提升供应链和产业链的协作效率。

      • 个性化定制:实现用户个性化需求驱动的柔性生产模式,提升产品多样性和用户满意度。

      • 服务化延伸:从产品主导转向服务主导,通过在线监测、远程运维、预测性维护等服务延长价值链,提升附加值。

      • 数字化管理:基于实时全流程数据进行科学决策分析,优化日常经营,辅助战略规划,并降低管理变革的试错成本。

    • 可持续发展效益:索理思的OPTIX™应用智能平台案例表明,AI驱动的自动化化学控制系统能显著优化化学剂量,例如湿强度化学成分减少25%,平均用量减少18%。这不仅提高了产品质量,还通过优化配料组合(如使用可回收或质量不达标的纸张),在纤维利用方面实现了可持续发展目标。智能制造能够以更低能耗的生产方式、更强劲的发展范式赋能能源利用效率的提升。

    • 未来工厂(AVEVA):未来的工厂将是智能化、自动化和高效互联的设施,平衡可持续发展、数字化转型和效率。数字孪生将是核心,它整合了工程设计和运营数据,提供可操作的洞察,帮助企业做出更明智、更可持续的决策,并减少浪费。通过数字孪生,工厂能实现成本降低(建造:5%-10%,运营:10%-20%),并提高生产率。

AI基础设施的未来路线图与投资展望

NVIDIA的年度路线图展现了其在AI基础设施领域的长期规划和前瞻性布局,旨在推动整个行业向AI工厂转型。

  • 年度架构迭代:NVIDIA的AI基础设施建设具有明确的年度迭代节奏。除了Blackwell和Blackwell Ultra外,未来的架构包括:

    • Vera Rubin (2025年下半年): 将进一步提升CPU、GPU、网络和内存性能,为下一代AI工作负载做准备。

    • Rubin Ultra (2027年下半年): 将实现MVLink 576的极致扩展,提供15 Exaflops的超强计算能力和4.6 PB/s的带宽,进一步降低单位功耗下的成本,推动AI工厂的规模化发展。

  • 纵向扩展(Scale-up)与横向扩展(Scale-out):NVIDIA的战略是先实现极致的纵向扩展(如Grace Blackwell NVLink 72、Rubin MVLink 144、Rubin Ultra MVLink 576),再通过Infiniband和Spectrum X等技术进行横向扩展,连接成数百万GPU的超大规模集群。为了支持大规模横向扩展,NVIDIA正在投资硅光子技术,旨在显著降低长距离连接的能耗和成本。

  • AI工厂的经济效益:AI工厂的建设是一项复杂的工程,需要数十万工人、数十亿部件和数百万米光纤。通过构建数据中心的数字孪生,可以在物理建设前进行设计和优化,从而提高效率并减少错误。黄仁勋展示了在100兆瓦工厂中,Blackwell相较于Hopper,能以更少的芯片和机架,产生更高的每秒令牌数,从而实现更高的营收潜力。例如,Hopper工厂每兆瓦可产生250万每秒令牌,而Blackwell能显著提升这一数字,意味着在电力限制下能产生更高的价值。

  • 智能制造提升能源利用效率:智能制造对城市能源利用效率具有显著的促进作用。这种提升得益于:

    • 生产流程优化:智能制造串联了从物料供应到产品管理的全链条,实时监控生产指标,减少人为错误和低效环节造成的资源浪费,从而提高生产效率和规模。

    • 能源结构优化:智能制造在能源运行控制、终端用户综合能源服务方面的应用,促使企业减少传统能源使用,加速可再生能源和设备的普及,推动能源发展模式向可持续、环保转变。

    • 人机协作的重要性:研究表明,人机协作是智能制造提升能源利用效率的关键动力机制。当人机协作水平达到阈值(0.4701)时,智能制造对能源利用效率的促进作用将显著增强。这意味着,单纯引入智能技术不足以最大化效益,还需同步提升劳动者与机器的协作匹配能力,避免“索罗悖论”。

    • 区域差异化发展:智能制造对能源利用效率的促进作用在中西部地区城市、数字经济发展水平高的城市以及非资源型城市更为显著。这提示政府在推广智能制造时应因地制宜,考虑区域差异化战略,例如加强中西部地区数字技术支持,并帮助资源型城市摆脱对传统资源的依赖。

结论

GTC 2025上黄仁勋的演讲清晰地描绘了NVIDIA在人工智能领域的宏伟蓝图。从革命性的Blackwell架构,到将推理视为未来AI工厂的核心工作负载,再到通过CUDA-X库、Omniverse平台和Dynamo操作系统构建的全栈AI加速生态系统,NVIDIA正在为全球AI的开发、训练和部署奠定坚实基础。AI在自动驾驶、机器人和企业计算等多个行业的广泛应用,以及清晰的年度AI基础设施发展路线图,共同揭示了AI工厂作为全新计算范式所蕴含的万亿级市场机遇。对于金融行业的专业人士而言,理解这些技术趋势及其经济驱动力,将是洞察未来投资方向、把握市场先机、实现可持续增长的关键。

免责声明

本文内容基于提供的原始资料和对话历史生成。所提供的信息仅供参考,不构成任何投资建议或财务建议。读者在做出任何投资决策前,应独立进行研究和咨询专业意见。本文不承担任何因依据本内容而采取行动所导致的损失责任。


本文由《华尔街透视》推荐,敬请关注公众号: wallstreetreview
《华尔街透视》以独特的视角和严谨的分析,剖析金融事件背后的逻辑。我们通过数据和事实呈现市场状况,帮助读者形成独立思考。本文仅代表作者个人观点,不构成投资意见,并不代表本平台立场。文中的论述和观点,敬请读者注意判断。

版权声明:「华尔街透视」除发布原创市场投研报告外,亦致力于优秀财经文章的交流分享。部分文章、图片和资料来自网络,版权归原创。推送时未能及时与原作者取得联系。若涉及版权问题,敬请原作者添加WSCHELP微信联系删除。谢谢授权使用!

关于华尔街俱乐部
华尔街俱乐部凝聚华尔街投行的高端资源,为中国民营企业“走出去”提供全方位的顾问服务,包括企业赴美上市、战略投资、并购、私募路演和投资者关系等。在投资理念和技术方面提供华尔街投行专家实战培训,为您进入华尔街铺设成功之路。联系我们:wsreview@wallstreetclub.org


【声明】内容源于网络
0
0
华尔街俱乐部
华尔街俱乐部凝聚华尔街投行的高端资源,为中国民营企业“走出去”提供全方位的顾问服务,包括企业赴美上市、战略投资、并购、私募路演和投资者关系等。在投资理念和技术方面提供华尔街投行专家实战培训,为您进入华尔街铺设成功之路。
内容 4745
粉丝 0
华尔街俱乐部 华尔街俱乐部凝聚华尔街投行的高端资源,为中国民营企业“走出去”提供全方位的顾问服务,包括企业赴美上市、战略投资、并购、私募路演和投资者关系等。在投资理念和技术方面提供华尔街投行专家实战培训,为您进入华尔街铺设成功之路。
总阅读12
粉丝0
内容4.7k