【灵思导读】 菲尔兹奖得主陶哲轩在斯坦福演讲后宣布调整个人工作习惯:不再设法实时跟踪所有新证明。AI生成证明的速度已远超人类吸收能力,数学正被自身产出不断膨胀。
陶哲轩,公开承认AI已根本性改变数学工作流程。
周三,这位菲尔兹奖得主在斯坦福大学发表了一场演讲,题目是《新数学工作流》。
随后在Mathstodon上发了一则公告:
他要调整自己的工作习惯,不再试图实时跟进所有新证明。
一位每年审阅上百篇论文的数学家,亲自为自己按下了暂停。
原因不是他老了,也不是累了,而是一个他亲眼见证的事实:
AI生成数学证明的速度,早已超过人类消化证明的速度。
数学正被AI撑满。
证明,不再稀缺
陶哲轩在演讲开头便抛出一个判断:
数学正经历其他科学领域早已历过的那场变革。
生物学有基因测序爆发、天文学有数据洪流,每个学科迈入「数据丰裕」时代后,都被迫重建自身工作流程。
AI时代,数学的对应版本是:证明丰裕。
数千年来,数学一直活在「证明稀缺」的年代。
看看数学论文的署名传统就明白——其他学科早已习惯10人、20人、50人合著的常态,而数学一百多年来还停留在1-2人。
陶哲轩在演讲里直接放了一张对比图,那条几乎贴着底线的线就是数学。
为什么数学如此特别?因为证明代价极高。
一个定理的诞生要花几年甚至几十年——Andrew Wiles把自己关了7年才证完费马大定理。
在那个稀缺年代,「谁最先迈出帐篷」就是最自然的衡量标准。
社会把一切——荣誉、教职、奖项、定理署名权——都给了他。
这套激励机制运转得非常好,因为它跟「促进整个数学社群进步」的目标大体一致:
第一个走出来的人,通常也是把问题讲得最清楚的人。
一个猜想悬在那里几十年,全球最聪明的头脑轮番上阵,能解出来便是载入史册的事件。
整个学科的激励体系、荣誉体系、评价体系,全部建立在这个稀缺性之上。
而现在,稀缺性正被AI消除。
陶哲轩举了一个具体例子。
Erdős问题网站——数学界最著名的未解难题清单之一,目前已有大约20篇AI辅助解题方案处于积压待审状态。
提交者自己承认:根本没时间手动验证。
不是没人想看,而是看不过来。
陶哲轩将其比作19世纪的汽车困境——车的速度越来越快,但当时的道路系统根本承载不了。
结果不是交通更快了,而是交通更堵了。
AI确实能生成数学难题的证明。
但证明堆在那里没人消化,就等于什么都没证明。
数学家的工作流,被AI切成三段
陶哲轩在演讲中把数学生产过程拆成三步。
第一步,证明生成。
AI现在已能批量产出。
GPT-5.5、Claude Opus 4.7、专门做形式化数学的求解器,一夜之间能涌出几十条新证明。一年前还算惊喜的事,如今变成了生产线日产量。
第二步,证明验证。
Lean、Coq这类形式化验证工具大半年迭代一次。
AI加Lean让验证流程半自动化,审稿人不再需要一行一行手算每个引理。
GPT-5.2解Erdős#728那次,验证环节由工具Aristotle自动完成,陶哲轩本人只在最后确认了一下。
第三步,消化与理解。
现在,完全空白。
没有任何工具能帮数学家把机器证完的东西,转变成人类读得懂的洞见。
一条证明被形式化验证为正确,跟它对数学家有用,是两码事。
前两个阶段越快,第三阶段就越追不上。
更要命的是,目前学术界没有任何成型的方法论,能让数学家批量消化AI产出的证明。
每天审稿邮件里塞满Lean验证过的新证明,能读的人就那么几个。
陶哲轩说了一句被现场反复引用的话:
数学的本质,不是积累正确证明的数量,而是让人类理解这个世界为什么这样运行。
机器解出#1196是一回事。
陶哲轩亲自从Price的证明里提炼出「向下冯·曼戈尔特链」这种新概念、再把它扩展成新理论,是另一回事。
前者AI可以包圆。
后者目前还得靠人来做。
而且越来越没人做得过来。每天几十条新证明涌出,能读懂的数学家就那么多。
瓶颈不在生产端,而在阅读端。
技术上正确,但无人理解
真正让陶哲轩警觉的,不是AI生成证明的速度,而是AI生成的证明长什么样子。
他在演讲中做了一个关键区分:数学研究有两类目标。
第一类是显性目标——证明某个定理、解决某个猜想。就是写在论文标题里的那种。
第二类是隐性目标——弄清这个证明与已有文献的关系、发现后续的自然问题、提炼新的技术手段、理解核心难点在哪里,以及最重要的:让做研究的人自身变得更强。
过去几百年里,这两类目标从来不需要分开讨论。
因为当一位人类数学家解决一个问题时,隐性目标是自动完成的——你不可能在证明过程中不了解文献、不发现新问题、不训练自身直觉。
AI把它们拆开了。
AI可以在技术层面解决显性目标,给出一个逻辑上正确的证明。但它生成的证明不引用已有文献,不突出核心思想,不启发后续研究,也不帮任何人变得更聪明。
用陶哲轩的表述:这种证明技术上正确,但与数学的真正进步目标相脱节。
一道题被AI解了,但数学界对这道题的理解没有增加一毫米。
这就像一个学生在考试里拿了满分,但走出考场什么都没学到。
古德哈特定律发作了
陶哲轩在演讲里引入了一个经济学概念:古德哈特定律。
一个学术界耳熟能详的名字——Charles Goodhart,1975年提出了以他命名的定律:
当一个衡量标准变成目标,它就不再是好的衡量标准。
这条定律过去50年发生过无数次:
KPI文化下的销售造假
Twitter把互动变成算法目标,结果催生了愤怒经济
学术影响因子被刷成了产业链
数学曾经是少数没被它击穿的领域。
翻译到数学界:「谁第一个证明了这个定理」,曾经是衡量数学进步的好指标。
因为在证明稀缺的年代,能第一个证明的人,一定深入理解了问题,也一定推进了数学前沿。
显性目标和隐性目标完全对齐。
而AI让这种对齐崩坏了。
第一个证明的速度可以被无限加快,但理解不能。
当整个社群开始无限制地内卷「证明速度」,这个指标就跟真正的数学进步脱钩了。
继续按旧规则玩,不仅不创造进步,反而在多方面阻碍数学发展。
陶哲轩的建议很明确:停止对「谁是第一个解决某个未解难题」的过度执念。
把锦标赛式的极限优化引导到更可控的方向——比如专门为重度使用AI而设计的数学竞赛工作流,让竞速归竞速,让理解归理解。
一位菲尔兹奖得主亲自为数学界的旧游戏规则判了缓刑。
数学只是一个预告片
把视线从数学拉远一些。
陶哲轩描述的这个困境——AI产出速度远超人类消化速度,显性目标与隐性目标被强行解耦——并非数学独有。
代码可以被AI大量生成,但没人审核。
论文可以被AI批量写出,但没人阅读。
诊断可以被AI秒出,但医生来不及理解推理过程。
每一个知识密集型行业,都在走向同一个岔路口:产出在爆炸,理解在停滞。
陶哲轩在演讲中反复强调一句话:数学不只是一堆互不相关定理的集合,它上面有一整套系统。
证明是砖。但建筑不是砖堆。
当AI能无限供应砖块时,建筑师比砖匠更重要。
问题是,连建筑师都快被埋在砖堆下面了。
陶哲轩选择不再追赶。
不是追不上,而是他发现,追赶本身正在变成问题。
锦标赛灯光熄灭,剧场刚刚开门
陶哲轩在演讲最后,留下了一个具体建议。
为AI重度使用设计专门的数学竞赛。
评判标准不再是「谁先证出来」,而是谁的证明体系最有解释力、谁的形式化最干净、谁能推动整个领域消化某个突破。
这句话的潜台词很清楚:奖项、期刊、招聘评价——所有建立在证明稀缺时代之上的制度,都要重做。
数学不是被AI终结的第一门学科。
但它是第一门由顶级专家亲手宣告规则失效的学科。
物理、化学、生物大概率会跟上。
千百年来,数学家比谁先证出来。
从今天起,比的是谁更能读得懂AI的证明。
———— END ————
灵思极智旗下“极智系列”三款AI智能应用
关注后,两步置顶服务号,可第一时间收到灵思极智推文!

