【灵思分享】陶哲轩：AI正迫使千年数学规则迎来重置- 大数跨境

首页

【灵思分享】陶哲轩：AI正迫使千年数学规则迎来重置

灵思极智

2026-05-28

【灵思导读】菲尔兹奖得主陶哲轩在斯坦福演讲后宣布调整个人工作习惯：不再设法实时跟踪所有新证明。AI生成证明的速度已远超人类吸收能力，数学正被自身产出不断膨胀。

陶哲轩，公开承认AI已根本性改变数学工作流程。

周三，这位菲尔兹奖得主在斯坦福大学发表了一场演讲，题目是《新数学工作流》。

随后在Mathstodon上发了一则公告：

他要调整自己的工作习惯，不再试图实时跟进所有新证明。

一位每年审阅上百篇论文的数学家，亲自为自己按下了暂停。

原因不是他老了，也不是累了，而是一个他亲眼见证的事实：

AI生成数学证明的速度，早已超过人类消化证明的速度。

数学正被AI撑满。

证明，不再稀缺

陶哲轩在演讲开头便抛出一个判断：

数学正经历其他科学领域早已历过的那场变革。

生物学有基因测序爆发、天文学有数据洪流，每个学科迈入「数据丰裕」时代后，都被迫重建自身工作流程。

AI时代，数学的对应版本是：证明丰裕。

数千年来，数学一直活在「证明稀缺」的年代。

看看数学论文的署名传统就明白——其他学科早已习惯10人、20人、50人合著的常态，而数学一百多年来还停留在1-2人。

陶哲轩在演讲里直接放了一张对比图，那条几乎贴着底线的线就是数学。

为什么数学如此特别？因为证明代价极高。

一个定理的诞生要花几年甚至几十年——Andrew Wiles把自己关了7年才证完费马大定理。

在那个稀缺年代，「谁最先迈出帐篷」就是最自然的衡量标准。

社会把一切——荣誉、教职、奖项、定理署名权——都给了他。

这套激励机制运转得非常好，因为它跟「促进整个数学社群进步」的目标大体一致：

第一个走出来的人，通常也是把问题讲得最清楚的人。

一个猜想悬在那里几十年，全球最聪明的头脑轮番上阵，能解出来便是载入史册的事件。

整个学科的激励体系、荣誉体系、评价体系，全部建立在这个稀缺性之上。

而现在，稀缺性正被AI消除。

陶哲轩举了一个具体例子。

Erdős问题网站——数学界最著名的未解难题清单之一，目前已有大约20篇AI辅助解题方案处于积压待审状态。

提交者自己承认：根本没时间手动验证。

不是没人想看，而是看不过来。

陶哲轩将其比作19世纪的汽车困境——车的速度越来越快，但当时的道路系统根本承载不了。

结果不是交通更快了，而是交通更堵了。

AI确实能生成数学难题的证明。

但证明堆在那里没人消化，就等于什么都没证明。

数学家的工作流，被AI切成三段

陶哲轩在演讲中把数学生产过程拆成三步。

第一步，证明生成。

AI现在已能批量产出。

GPT-5.5、Claude Opus 4.7、专门做形式化数学的求解器，一夜之间能涌出几十条新证明。一年前还算惊喜的事，如今变成了生产线日产量。

第二步，证明验证。

Lean、Coq这类形式化验证工具大半年迭代一次。

AI加Lean让验证流程半自动化，审稿人不再需要一行一行手算每个引理。

GPT-5.2解Erdős#728那次，验证环节由工具Aristotle自动完成，陶哲轩本人只在最后确认了一下。

第三步，消化与理解。

现在，完全空白。

没有任何工具能帮数学家把机器证完的东西，转变成人类读得懂的洞见。

一条证明被形式化验证为正确，跟它对数学家有用，是两码事。

前两个阶段越快，第三阶段就越追不上。

更要命的是，目前学术界没有任何成型的方法论，能让数学家批量消化AI产出的证明。

每天审稿邮件里塞满Lean验证过的新证明，能读的人就那么几个。

陶哲轩说了一句被现场反复引用的话：

数学的本质，不是积累正确证明的数量，而是让人类理解这个世界为什么这样运行。

机器解出#1196是一回事。

陶哲轩亲自从Price的证明里提炼出「向下冯·曼戈尔特链」这种新概念、再把它扩展成新理论，是另一回事。

前者AI可以包圆。

后者目前还得靠人来做。

而且越来越没人做得过来。每天几十条新证明涌出，能读懂的数学家就那么多。

瓶颈不在生产端，而在阅读端。

技术上正确，但无人理解

真正让陶哲轩警觉的，不是AI生成证明的速度，而是AI生成的证明长什么样子。

他在演讲中做了一个关键区分：数学研究有两类目标。

第一类是显性目标——证明某个定理、解决某个猜想。就是写在论文标题里的那种。

第二类是隐性目标——弄清这个证明与已有文献的关系、发现后续的自然问题、提炼新的技术手段、理解核心难点在哪里，以及最重要的：让做研究的人自身变得更强。

过去几百年里，这两类目标从来不需要分开讨论。

因为当一位人类数学家解决一个问题时，隐性目标是自动完成的——你不可能在证明过程中不了解文献、不发现新问题、不训练自身直觉。

AI把它们拆开了。

AI可以在技术层面解决显性目标，给出一个逻辑上正确的证明。但它生成的证明不引用已有文献，不突出核心思想，不启发后续研究，也不帮任何人变得更聪明。

用陶哲轩的表述：这种证明技术上正确，但与数学的真正进步目标相脱节。

一道题被AI解了，但数学界对这道题的理解没有增加一毫米。

这就像一个学生在考试里拿了满分，但走出考场什么都没学到。

古德哈特定律发作了

陶哲轩在演讲里引入了一个经济学概念：古德哈特定律。

一个学术界耳熟能详的名字——Charles Goodhart，1975年提出了以他命名的定律：

当一个衡量标准变成目标，它就不再是好的衡量标准。

这条定律过去50年发生过无数次：

KPI文化下的销售造假

Twitter把互动变成算法目标，结果催生了愤怒经济

学术影响因子被刷成了产业链

数学曾经是少数没被它击穿的领域。

翻译到数学界：「谁第一个证明了这个定理」，曾经是衡量数学进步的好指标。

因为在证明稀缺的年代，能第一个证明的人，一定深入理解了问题，也一定推进了数学前沿。

显性目标和隐性目标完全对齐。

而AI让这种对齐崩坏了。

第一个证明的速度可以被无限加快，但理解不能。

当整个社群开始无限制地内卷「证明速度」，这个指标就跟真正的数学进步脱钩了。

继续按旧规则玩，不仅不创造进步，反而在多方面阻碍数学发展。

陶哲轩的建议很明确：停止对「谁是第一个解决某个未解难题」的过度执念。

把锦标赛式的极限优化引导到更可控的方向——比如专门为重度使用AI而设计的数学竞赛工作流，让竞速归竞速，让理解归理解。

一位菲尔兹奖得主亲自为数学界的旧游戏规则判了缓刑。

数学只是一个预告片

把视线从数学拉远一些。

陶哲轩描述的这个困境——AI产出速度远超人类消化速度，显性目标与隐性目标被强行解耦——并非数学独有。

代码可以被AI大量生成，但没人审核。

论文可以被AI批量写出，但没人阅读。

诊断可以被AI秒出，但医生来不及理解推理过程。

每一个知识密集型行业，都在走向同一个岔路口：产出在爆炸，理解在停滞。

陶哲轩在演讲中反复强调一句话：数学不只是一堆互不相关定理的集合，它上面有一整套系统。

证明是砖。但建筑不是砖堆。

当AI能无限供应砖块时，建筑师比砖匠更重要。

问题是，连建筑师都快被埋在砖堆下面了。

陶哲轩选择不再追赶。

不是追不上，而是他发现，追赶本身正在变成问题。

锦标赛灯光熄灭，剧场刚刚开门

陶哲轩在演讲最后，留下了一个具体建议。

为AI重度使用设计专门的数学竞赛。

评判标准不再是「谁先证出来」，而是谁的证明体系最有解释力、谁的形式化最干净、谁能推动整个领域消化某个突破。

这句话的潜台词很清楚：奖项、期刊、招聘评价——所有建立在证明稀缺时代之上的制度，都要重做。

数学不是被AI终结的第一门学科。

但它是第一门由顶级专家亲手宣告规则失效的学科。

物理、化学、生物大概率会跟上。

千百年来，数学家比谁先证出来。

从今天起，比的是谁更能读得懂AI的证明。

———— END ————

灵思极智旗下“极智系列”三款AI智能应用

灵思极智让AI为各行业赋能

打造[超级企业]+[超级个体]

“让人回归人的价值”！

用灵思，创极智！点击关注“灵思极智”

关注后，两步置顶服务号，可第一时间收到灵思极智推文！

【声明】内容源于网络

灵思极智

AI领域超级创造工厂，用灵思，创极智！

内容 176

粉丝 0

灵思极智 AI领域超级创造工厂，用灵思，创极智！

总阅读135

粉丝0

内容176