【导读】
48小时,50年数学谜题被成功破解!AI与全球数学家协同攻关,从硬币游戏建模到正方形填充等价转化,层层突破埃尔德什#1026问题,标志着人机协作正重塑数学研究新范式。
Erdős #1026问题的破题历程
1975年,保罗·埃尔德什在论文边角随手提出一个问题,编号#1026,此后半世纪悬而未决。2025年12月,由陶哲轩发起、多位数学家与AI系统协作,在48小时内完成形式化证明与完整公式推导。
问题本质:硬币游戏与单调子序列
给定互异实数序列 x1, …, xn,定义 S(x1, …, xn) 为所有单调(递增或递减)子序列元素和的最大值。核心追问:该函数的渐近行为如何?即比值 c(n) = inf S / Σxi 的下确界?
Desmond Weisenberg将其转化为Alice-Bob硬币游戏:Alice将N枚硬币分为n堆(每堆xi枚),Bob选取单调子序列取走对应堆全部硬币。问题转化为——无论Alice如何分配,Bob至少能获得总硬币数的多少比例?此比例记作c(n)。
从平方数猜想至精确公式
Stijn Cambie发现:当n = k2时,通过构造k个递减块(每块k堆,块间递增),最长单调子序列长度仅为k,故c(k2) ≤ 1/k;Wouter van Doorn则给出下界c(n) ≥ (1/√2)/√n。二者夹逼指向极限:√n·c(n) → 1。
Boris Alexeev于2025年12月7日使用Harmonic公司AI系统Aristotle,在Lean中自动验证c(k2) = 1/k;Koishi Chan同步给出人类可读的「膨胀法」证明,实现上下界统一。
AI驱动的全公式发现
陶哲轩调用AlphaEvolve系统生成极小化S的序列,计算得n=1至16的c(n)数值,并观察出规律。Boris据此提炼出通解公式:
c(n) = max{ k/(k² + a) ∣ k ∈ ℕ⁺, a ∈ [0, k), k² + 2a + 1 ≥ n }。
该公式对应一种红蓝双值块交替构造法,可严格控制单调子序列长度;其倒数1/c(n)图像呈现对√n的分段线性逼近特征。
连接经典:正方形填充等价性
Lawrence Wu指出,该问题等价于埃尔德什问题#106(正方形填充):对任意序列,可构造互不重叠的正方形,恰好填满边长为S的大正方形,从而导出c(n) ≥ 1/f(n)。
借助Baek-Koizumi-Ueoro 2024年关于f(k²+2c+1)的上界结果,及Praton嵌入论证,最终完成c(n)上下界的完全吻合,实现严格证明。
AI+人类:48小时极限协作范式
此次突破依赖跨地域、跨工具、跨知识背景的实时协同:数值计算、模式识别、形式化验证、文献溯源、经典定理重构等环节,在48小时内闭环整合。相较传统模式需数周乃至数月,效率跃升显著。
关键支撑在于埃尔德什问题网站的开放AI政策:要求使用者公开声明AI参与、自主核查全部推导与数据、评论篇幅合理——确保透明性与学术严谨性并存。
一道悬置50年的数学谜题,在2025年冬日迎来终章。这不仅是单个问题的解决,更预示着AI深度融入数学发现流程的新纪元已然开启。

