视频号:黄益贺
YouTube / Medium: huangyihe
如果只能持有一支股票,那我肯定选择英伟达,并且我会持有十年。因为通用科学计算是比生成式AI更大的市场、更大的机会。
老黄这两年一直在谈的“数字孪生”和“AI for Science”,说的就是通用科学计算。它的本质,是“模拟物理世界”。
在这个领域,英伟达具有统治地位。“通用科学计算”目前几乎等同于“使用英伟达GPU进行的加速计算”。
更重要的是,英伟达的竞争对手是赶不上来的。因为他们的东西都是为AI而生,为模型的训练和推理而量身定制的。他们砍掉了太多通用性。这反而把他们锁死在AI市场。
一旦计算范式从“语言统计概率”回到“物理方程求解”,TPU们就成了废铁。
所以,短期来看,比如三年内,AI一定是市场热点。但是你把时间轴拉长的话,通用科学计算是比生成式AI更宏大、更深邃的市场。
如果你是做投资的,现在可以不布局,但你不能不知道。否则你跟那些炒A股的大爷大妈有什么区别?
哈喽各位好,欢迎回到我的频道。谦虚地说,我是国内少数几个能把关于AI的Why和How讲明白的博主。我提供的东西远比教程更值钱。记得点一波关注。如果想链接我,就来我们newtype社群。这个社群已经运营600天,有超过1900位小伙伴付费加入啦。
如果你是国内用户,可以从知识星球加入。如果你是海外用户,可以从Substack加入。我的第一套课程、日常的Newsletter以及专属视频,在社群内都可以看到。
回到今天的主题:英伟达的通用加速计算。
上上期视频,我介绍了TPU,谈到了为什么TPU无法取代GPU。
为了训练和推理大模型,以TPU为代表的ASIC砍掉了高精度计算单元,专注于FP16、FP8甚至INT4。因为生成文本不需要高精度。
这一刀砍下去,确实让TPU在AI领域很厉害。但是,这是以牺牲通用性为代价的。
英伟达一直在坚持的,就是通用加速计算。他们吃到AI这碗饭纯属偶然。
CUDA是在2006到07年发布的。而深度学习是在2012年爆发的。这中间有整整六年的空窗期。
在这六年里,老黄压力非常大。他极度痛苦地向物理学家、化学家、石油勘探专家和金融分析师推销CUDA。当时华尔街和硅谷很多人认为他疯了,把显卡搞得这么复杂,导致成本飙升,结果却只是去服务那些非常小众的科学家。
2012 年,Alex之所以选择英伟达GPU来训练神经网络,不是因为英伟达专门为AI做了什么,纯粹是因为这是市面上唯一能买到的、能用C语言编程的、便宜的并行计算硬件。
所以,GPU不是为了AI而生的,它是为通用科学计算服务的。它在设计上保留了两个关键特性,两个现在的ASIC无法超越的特性。
第一,极高的可编程性。
专用的ASIC往往会针对某一类算法优化。一旦算法变了,芯片就废了。而CUDA是通用的。算法变了的话,你只要重写代码就能跑。这也是为什么AI论文总是最先在英伟达的芯片上复现。
第二,对精度的执念。
刚才说了,TPU为AI进行优化,砍掉了高精度部分。但是,你要搞科研的话,必须高精度,比如FP64。因为科学计算对误差极度敏感。这是TPU做不到、而GPU可以做的地方。
ASIC/TPU的强项是“矩阵乘法加速器”。但是科学计算是极其复杂的。比如蛋白质折叠不仅仅是矩阵运算,还包含复杂的几何搜索和图论算法。而这些都是英伟达的强项,GPU和CUDA非常适合,积累了很多年。科学家们不可能转阵营,因为迁移成本太高了,约等于重写整个学科的软件基础设施。
刚才说的都是逻辑。我再给你数据。top500.org这个网站列出了超级计算机榜单。你可以去把表格下载下来,筛选出英伟达的部分,就知道他们在这个领域有多强了。
以上说的都是为什么在通用科学计算方面,只有GPU可行,TPU完全不灵。那么问题来了:通用科学计算的市场有多大?会比生成式AI还大吗?
我从这三个维度来分析。
第一,市场的本质。
生成式AI市场的本质是“比特经济”。它的天花板是人类的注意力。生成再多的视频和文章,人类看不过来,那么它的商业价值就会边际递减。所以目前来看,生成式AI是一个大约数万亿美元的数字经济市场。
通用科学计算市场的本质是“原子经济”。它的天花板是物理世界的效率。人类对更便宜的药、更高效的电池、更清洁的能源的需求几乎是无限的。所以综合来看,这是一个近百万亿美元的实体经济市场。
第二,收入模式。
生成式AI在今天遇到的尴尬是,很多企业买显卡搞AI,但还在苦苦寻找商业模式。
但科学计算是刚需,因为它直接切的是全球工业研发的预算。
举个例子。全球前十大制药厂,每年的研发投入加起来超过 1000亿美元。如果英伟达的模拟能把一款新药的研发成本从20亿美元降到10亿美元,或者把成功率提高一倍,药企绝对会毫不犹豫地把大笔预算交给英伟达。
还有,汽车风洞测试、石油勘探试钻,一次都是几百万美元的物理成本。用GPU模拟的话,哪怕只替代一半,这都是千亿级的市场转移。
在这个领域,英伟达不是在卖“算力”,而是在卖“数字化实验室”。这个溢价能力远高于卖给云计算厂商。
第三,护城河。
生成式AI市场最终一定会变成红海,因为推理的设备越来越多,门槛会越来越低。但通用科学计算市场不会,因为需要高精度、需要几十年积累的物理算法库。目前只有英伟达能做。
一旦工业界习惯了用Omniverse和CUDA进行研发,那他们就再也离不开,因为这涉及到底层数据资产。
总结一下,你可以这样理解这两个市场的关系:
生成式AI是“先锋”。
它让全世界意识到了GPU的强大,让英伟达赚到了第一桶金。
通用科学计算是“主力”。
老黄想把价值100万亿美元的全球实体工业,搬到英伟达的芯片上运行。这才是他的真正野心。
算力的尽头是物理模拟,而不仅仅是语言生成。这是比生成式AI更大的机会。
OK,以上就是本期内容。想了解AI,想成为超级个体,想找到志同道合的人,就来我们newtype社群。那咱们下期见!

