如果当前人工智能的规模化竞赛持续至2030年,世界将迎来怎样的图景?
一份由 EPOCH AI 最新发布的报告,深入探讨了这场规模化竞赛在算力、投资、数据、硬件乃至能源层面所引发的巨大需求。
报告的核心论点是:尽管面临着前所未有的基础设施挑战,AI 的规模化之路大概率将持续至2030年,并最终在科学及其他众多领域释放出颠覆性的力量。
以下,我们将分享报告中的部分核心发现。
依据现有趋势推算,到2030年,用于训练前沿 AI 的计算集群,其成本将突破1000亿美元。
这样的集群能支持约10^29 FLOP的单次训练算力——这个数字意味着,它运行一次所完成的计算量,需要2020年全球最大的 AI 集群不间断地运行超过3000年。
在这类集群上训练出的 AI 模型,其算力消耗将是 GPT-4 的数千倍,电力需求也将达到吉瓦级别。
这个推演揭示出我们研究中反复出现的一种规律:若现有趋势得以延续,其最终结果将是极为惊人的。
那么,我们该如何看待这种趋势的持续性?
回顾过去十年,基于趋势的外推已被证明是相当可靠的预测基准。当我们深入审视那些预示发展即将放缓的论点时,发现它们往往缺乏足够的说服力。
下面我们逐一剖析这些主流的“放缓论”,并阐述报告的结论:
观点1:规模化可能“撞墙”,即 AI 系统在持续扩大规模后,性能不再提升。
结论:近期前沿模型在各项基准测试和商业营收上均实现了巨大突破。虽然“撞墙”的风险客观存在,但目前尚无任何明确迹象。
观点2:训练数据即将耗尽。
结论:仅公开的人类生成文本数据,就足以支撑规模化扩张至少到2027年。此外,合成数据已能大规模生成,其有效性在推理模型诞生后也得到了更好验证。因此,尽管无法完全排除数据瓶颈的可能,但这个问题看起来能够被克服。
观点3:电力供应将成为瓶颈。
结论:若规模化持续,到2030年,前沿模型的单次训练将需要吉瓦级的电力。如此巨大的电力需求确实构成供应难题,但通过太阳能、电池储能或离网天然气发电等方式,电力供应能力有望实现快速扩展。
更重要的是,前沿 AI 的训练任务已开始在地理上分散到多个数据中心,这有助于稀释挑战。我们判断,电力在2028年之前难以构成瓶颈,即便在此之后,问题似乎也终将有解。
观点4:成本过于高昂,将迫使开发者停止投资。
结论:这种可能性无法排除,但至今未见端倪。如果 AI 开发者的营收能按近期趋势持续增长,到2030年将足以覆盖我们预测的超千亿美元前沿训练投资。
数百亿乃至上千亿美元的 AI 营收看似夸张,但只要 AI 能在大部分工作任务中显著提升生产力,其撬动的经济价值便可能高达数万亿美元。
观点5:AI 发展的重心可能转向更高效率的算法。
结论:算法效率的提升,本就与现有算力的增长并行发生,从未停滞。没有特别的理由能预示算法进步会突然加速,即便如此,这也更可能激励行业去利用更多算力,而非减少。
观点6:AI 公司可能将算力更多地分配给推理(inference),以支持各类模型产品。
结论:目前,训练与推理获得的算力大致相当,且有理由相信两者应该同步扩张。扩大训练规模能创造出更强大的 AI 模型,从而以更普惠的成本执行更有价值的推理任务。因此,即便算力向推理端有所倾斜,也不太可能拖慢训练规模的扩张步伐。
综上所述,我们认为,将当前趋势外推至2030年,构成了一个强有力的基准预测。假如趋势得以延续,我们便能进一步描绘出 AI 能力的未来图景。
AI 将全面加速科学研发进程
种种能力趋势预示,AI 将在科学研发领域取得巨大突破,尤其是在软件工程和数学这类能够完全在数字环境中完成任务训练的学科。
现有基准测试的进展显示,到2030年,AI 将能够根据自然语言指令实现复杂的科学软件开发,协助数学家将直觉性的证明草图形式化,并回答有关生物学实验方案的复杂问题。
我们预测,到2030年,许多科学领域都将涌现出 AI 助理,其角色可类比今天软件工程师所使用的编程助手。
当然,不同领域的 AI 助理功能会有所侧重。例如,科学 AI 助理会更专注于审阅和整合海量、异构的学术文献,而现有 AI 编程工具主要局限于单个项目的代码环境。
尽管存在差异,它们的核心价值却高度相似:都能根据上下文提供智能建议、精准搜寻相关信息,并独立完成定义明确的小范围封闭任务。
借鉴软件工程领域的经验,我们预测,这类 AI 助理最终能在具体任务中带来10%至20%的生产力提升。也许数学家或理论生物学家的工作,其自动化难度要高于软件工程师,但相关基准测试的持续进步已经提供了积极信号,我们有理由期待未来数年更丰硕的成果。
我们相信,AI 的能力将为多个科学领域带来颠覆性变革,尽管其全面部署和效果的完全显现可能需要等到2030年之后。
以下,我们从报告中摘取四个领域的案例进行说明:软件工程、数学、分子生物学和天气预报。
需要强调的是,尽管选取的基准测试无法涵盖每个领域的全部挑战,但它们提供了一个独特的窗口,让我们得以窥见 AI 日益增强的能力,以及那些即将被自动化的任务。
软件工程:
借由代码助手和智能问答系统,AI 早已开始重塑软件工程行业。按照当前趋势,到2030年,AI将 能够自主修复程序故障、实现新功能,并解决那些定义明确但极具挑战性的科学编程问题。
数学:
AI 有望在不远的将来扮演研究助理的角色,帮助数学家填充证明细节或将直觉概念具体化。已有初步研究记录了 AI 在辅助数学家工作方面的价值。有趣的是,对于现有数学 AI 基准测试的实际意义,以及AI何时能从“助理”蜕变为独立产出数学成果,知名数学家们的观点大相径庭。
分子生物学:
在蛋白质-配体相互作用领域,像 PoseBusters 这类公开基准测试,有望在未来数年内被攻克。但对于更复杂的任意蛋白质间相互作用的预测,所需时间则更长且充满不确定性。
与此同时,服务于生物学研发的 AI 案头研究助理正呼之欲出。现有的生物学实验方案问答基准测试,预计将在2030年前被解决。这些基准虽不能代表分子生物学的全部挑战,但其发展趋势为观察 AI 在该领域的能力演进提供了具体视角。
天气预报:
在从数小时到数周的时间尺度上,AI 天气预报的准确性已能超越传统方法。不仅如此,AI 方法的运行成本效益更高,并且能通过持续学习更多数据来进一步优化性能。
未来的挑战在于提升现有预测的精度(尤其是对罕见天气事件的预测),并思考如何将这些更精准的预测转化为更广泛的社会效益。
贯穿我们研究的一大主题是,技术的实际部署和社会影响,其发展步伐可能显著落后于技术能力本身。
以新药研发与软件工程为例:软件工程的迭代周期更短,不涉及临床试验,极少关乎安全关键系统,其结果的正确性也往往易于大致检验,且拥有海量的训练数据。
鉴于这些差异,我们预计,到2030年获批上市的药物中,能从今天的 AI 工具中受益的将寥寥无几,更不用说受益于2030年的 AI 技术了。不过,届时在药物的早期研发阶段,AI 很可能已在发挥举足轻重的作用。
与此形成鲜明对比的是,我们预计软件工程行业届时将发生天翻地覆的变革,而面向科学研发乃至更广阔领域的软件开发,也将迎来黄金时代。
展望2030年,AI 极有可能成为贯穿整个经济体的关键基础设施,无缝融入人们与计算机和移动设备交互的每个角落。
倘若这些预测成真,那么对于所有关键决策者而言,在规划未来五年乃至更长远的发展时,将 AI 相关议题置于战略的绝对优先位置,将是至关重要的。
作者:David Owen
刊载于:EPOCH AI
Hi,我是盒里,关注 AI 领域的商业资讯与应用
本公众号仅用于记录我的个人日常阅读、思考
译文必然存在语言和翻译工具使用上的局限性
建议前往对应平台查阅原内容
▼ 欢迎关注公众号留言交流 ▼

