
"500亿美元已经是天文数字了,但我要告诉你们,到2027年,至少是1万亿美元。"
这句话不是从某个投行分析师嘴里说出来的,而是英伟达CEO黄仁勋在圣何塞GTC大会上的原话。
短短几个月,他对自家芯片的市场预期直接从5000亿美元翻倍到了1万亿。这种自信,放眼整个科技圈也没几个人敢这么玩。
从5000亿到1万亿,黄仁勋凭什么这么敢?
让我们先把时间拨回到去年。
2024年的GTC大会上,黄仁勋给出的数字是:到2026年,Blackwell和即将发布的Rubin芯片预计带来约5000亿美元的需求。
当时这个数字已经让华尔街一片哗然。5000亿是什么概念?相当于一个中等发达国家的GDP,或者超过特斯拉、Meta、奈飞三家巨头市值的总和。在半导体行业,这个数字几乎相当于全球芯片市场总规模的一半。
但黄仁勋显然觉得这个数字"太保守"了。
在周一的GTC主题演讲中,他站在台上,语气轻松得像在聊天气:"我不知道你们怎么想,但5000亿确实是一大笔钱。不过我要告诉你们,仅仅几个月后的今天,我看到的是——到2027年,至少是1万亿美元。
台下的投资人可能还没反应过来,但懂行的人已经意识到:这不是在发布产品,这是在宣示主权。
要知道,在科技行业,能把预期这么大幅度上调的情况极其罕见。通常CEO们都倾向于保守预测,万一达不到也不至于被打脸。但黄仁勋不一样,他向来以敢说话著称,而且最让人服气的是——他吹过的牛,基本都实现了。
Vera Rubin:英伟达的新王牌到底强在哪?
能让黄仁勋如此自信的底气,来自一颗代号"Vera Rubin"的芯片。
这颗以美国著名天文学家薇拉·鲁宾命名的芯片,被黄仁勋称为"AI硬件的最先进水平"。她命名的这位天文学家最大的贡献是发现了暗物质存在的证据,而英伟达用她的名字命名这款芯片,似乎也暗含着要在AI领域发现"新大陆"的野心。
Vera Rubin接替的是去年大热的Blackwell架构。如果说Blackwell已经够强了,那Rubin的提升幅度堪称恐怖,用"碾压"来形容都不为过。
根据英伟达1月份公布的官方数据:
| 性能指标 | Blackwell | Vera Rubin | 提升幅度 |
|---|---|---|---|
| 模型训练速度 | 基准 | 3.5倍 | 250%↑ |
| 推理速度 | 基准 | 5倍 | 400%↑ |
| 峰值算力 | - | 50 petaflops | - |
这个表格可能有点抽象,让我打个比方:如果你用Blackwell训练一个大模型需要一个月,换成Rubin只要不到9天。如果做推理部署——也就是模型上线后响应用户请求——Rubin的速度是Blackwell的整整5倍。
50 petaflops的峰值算力意味着什么?一秒钟能完成50千万亿次浮点运算。这种级别的算力,放在五年前,需要一个占地几百平米、耗电兆瓦级别的超级数据中心才能勉强达到。而现在,它将被塞进一块GPU里,安静地躺在一个机架上。
这种指数级的性能提升,在芯片发展史上也是相当罕见的。要知道,摩尔定律说的是每18-24个月晶体管数量翻倍,性能提升约一倍。而英伟达这次的代际提升,直接把性能翻了3到5倍。
英伟达预计将在今年下半年开始大规模量产Rubin芯片。这意味着,从今年年底开始,全球的AI公司将开始新一轮"换机潮"。那些去年刚花大价钱买了Blackwell的公司,可能又要开始排队抢购Rubin了。
为什么是现在?为什么是这个数字?
很多人可能会问:AI芯片的需求真有那么大吗?1万亿美元是不是吹过头了?
要回答这个问题,我们得看看过去两年发生了什么,以及接下来会发生什么。
2023年:ChatGPT点燃导火索
ChatGPT的横空出世,直接点燃了全球AI军备竞赛。微软、谷歌、亚马逊、Meta……所有科技巨头都在疯狂囤卡。一张英伟达H100的价格被炒到4万美元,依然供不应求。那时候买到卡就是赚到,谁的卡多,谁的模型就训练得快。
2024年:大模型竞赛白热化
到了2024年,情况变得更加疯狂。OpenAI、Anthropic、Google DeepMind、xAI之间的模型竞赛进入白热化阶段,训练一个前沿大模型的算力成本从几千万美元飙升到几亿甚至十几亿美元。
GPT-4、Claude 3、Gemini Ultra……每一个新模型的发布背后,都是上万张H100或Blackwell在日夜不停地运转。模型的参数规模从千亿级跃升到万亿级,需要的算力呈指数级增长。
而这还只是训练阶段。
2025-2027年:推理时代的到来
真正的大头在推理——也就是模型上线后的日常运转。
每天数以亿计的用户向ChatGPT、Claude、Gemini提问,背后是成千上万张GPU在日夜不停地运转。每一次对话、每一次代码生成、每一次图像创作,都需要消耗算力。
如果说训练是一次性的"建校工程",那推理就是持续不断的"日常运营"。而运营,永远是比建设更大的生意。
举个例子:训练GPT-4可能花了几亿美元,但一旦上线服务数亿用户,每天的推理成本可能就要千万美元级别。一年下来,推理成本可能是训练成本的几十倍。
这就是为什么黄仁勋敢把预期从5000亿翻倍到1万亿——因为他看到的不是一时的训练需求,而是持续爆发、永无止境的推理算力需求。
训练会趋于饱和,但推理永远不会。只要人类还在用AI,只要AI还在服务人类,就需要算力。而且是越来越多的算力。
1万亿美元背后,到底是谁在买单?
这个数字听起来很虚,但拆开来其实很实在。让我们看看都是谁在买这些芯片:
第一,云服务商:最大的金主
亚马逊AWS、微软Azure、谷歌云每年在AI基础设施上的资本开支都在以百亿美元计。2024年,三大云厂商的AI相关资本支出加起来已经超过1500亿美元,而且还在以每年50%以上的速度增长。
这些云厂商买芯片不是为了自己用,而是为了租给客户。越来越多的企业不再自己建数据中心,而是直接上云买算力。云厂商成了英伟达最大的分销渠道。
第二,企业级客户:AI转型刚需
从华尔街的投行到硅谷的独角兽,从制药巨头到汽车制造商,几乎每一家大公司都在搞自己的AI部署。摩根大通用AI做风控,辉瑞用AI研发新药,特斯拉用AI训练自动驾驶……
这些企业不一定自己买芯片,但他们会向云厂商购买算力,而云厂商的算力最终都流向了英伟达。这是一种"间接但持续"的需求。
第三,主权AI:国家队入场
这是黄仁勋最近经常提到的一个概念。各国政府意识到AI是国运之争,纷纷开始建设自己的国家级算力中心。从欧洲到中东,从东南亚到拉美,"主权AI"正在成为一个新风口。
法国要建欧洲最大的AI数据中心,沙特要把沙漠变成AI算力枢纽,日本、韩国、新加坡都在拼命囤卡。各国都想把AI的命脉掌握在自己手里,而不是完全依赖美国的云厂商。
第四,AI独角兽和创业公司
OpenAI、Anthropic、xAI这些AI独角兽,以及成千上万家AI初创公司,他们的生存完全依赖于英伟达的芯片。没有算力,再好的算法也是空中楼阁。
有意思的是,这些公司筹到的每一轮融资,很大一部分最终都流向了英伟达。投资人投给AI公司的钱,转手就变成了英伟达的芯片销售收入。
把这四股力量加在一起,1万亿美元 suddenly 就不那么夸张了。甚至可以说,如果AI继续以现在的速度发展,这个数字可能还偏保守。
不只是芯片,英伟达在下一盘更大的棋
黄仁勋的野心,从来就不止于卖芯片。
在GTC大会上,他花了大量时间讲的不是GPU的晶体管数量,而是AI工厂、数字孪生、物理AI、机器人、自动驾驶……
他的愿景是:英伟达不只是卖算力,而是要成为整个AI时代的"基础设施提供商"。
什么是AI工厂?在黄仁勋的构想中,未来的工厂不是生产物理产品,而是生产"智能"。数据是原材料,算法是生产线,GPU是机器,输出的是能够感知、理解、决策的AI模型。
什么是物理AI?就是让AI理解物理世界。现在的AI mostly 是在互联网上训练的,懂文字、懂代码,但不懂物理规律。下一代AI需要理解重力、摩擦力、材料属性,这样才能控制机器人、驾驶汽车、设计飞机。
从这个角度看,1万亿美元的芯片销售预测,其实只是一个开始。
就像英特尔定义了PC时代、高通定义了移动互联网时代,黄仁勋想要定义AI时代。他不仅要卖芯片,还要定义AI时代的计算架构、开发工具、生态标准。
写在最后:这是开始,还是巅峰?
回到开头的那个问题:黄仁勋凭什么这么敢?
答案其实很简单:因为他手里握着这个时代最稀缺的资源——算力。
在AI的世界里,算力就是石油,就是电力,就是货币。谁掌握了算力,谁就掌握了AI时代的命脉。而英伟达,就是那个掌控着算力源头的人。
竞争对手不是没有。AMD在追赶,谷歌在自研TPU,亚马逊有Trainium,微软据说也在搞自己的芯片。但问题是,英伟达不仅领先,而且还在加速拉开差距。
CUDA生态就是英伟达最深的护城河。十几年来,全球数百万AI开发者都是在CUDA平台上成长起来的。要让他们换个平台重新学习?代价太大了。
1万亿美元是不是终点?恐怕不是。黄仁勋的下一句话可能是:"这只是开始。"
毕竟,在AI的世界里,唯一不变的就是变化本身。而英伟达,似乎总能比变化跑得更快一步。
当十年后再回头看,今天的1万亿美元预测,或许只是历史长河中的一个小里程碑。

