大数跨境

【灵思发现】图灵奖得主高德纳惊呼:「不可思议!不可思议!」Claude攻克算法经典难题

【灵思发现】图灵奖得主高德纳惊呼:「不可思议!不可思议!」Claude攻克算法经典难题 灵思极智
2026-03-11
2
导读:谷歌 Nano Banana 2 一夜之间补齐短板,各类图解信手拈来,定价仅为 OpenAI 一半
图片

「不可思议!不可思议!」

究竟是什么让享誉世界的计算机科学家、数学巨匠、《计算机程序设计艺术》的作者、图灵奖得主高德纳(Donald Knuth)发出了如此感慨?

您猜得没错,正是人工智能。

在他近期发布于斯坦福大学官网的论文《Claude’s Cycles》中,开篇便用了「Shock! Shock!」这样直白的词汇,毫不掩饰地表达了他对人工智能展现出的强大能力的震撼。

紧接着他在文中写道:「昨日我得知,一个我钻研了数周的开放式问题,刚刚被 Claude Opus 4.6——Anthropic 公司三周前发布的混合推理模型——成功解决了!看来,我需要在某个时间点重新评估我对『生成式AI』的看法了。不仅我的猜想得到了一个相当不错的解答,而且这标志着自动推理与创造性问题解决领域的一次巨大飞跃,这确实是一件令人欣喜的事。我将在本文中简要叙述这一过程。」

此事迅速引发广泛关注,网友们纷纷发表评论,感叹新时代的开启。

以下是 Hacker News 用户 Ian Danforth 给出的内容概要:高德纳提出一个问题,他的朋友借助 Claude 进行了30多次尝试,在人类的精细指导下,Claude 最终编写出一个 Python 程序,成功为所有奇数情况找到了解。高德纳随后为这个方法撰写了证明,并对 Claude 的贡献感到非常满意。至于偶数情况,目前仍是未解之谜(Claude 在此方向上进展有限)。

困扰学术泰斗的图论挑战

高德纳在为《计算机程序设计艺术》未来卷撰写关于有向哈密顿环的内容时,遇到了一个棘手的开放性问题。

具体来说,需要研究一个包含 m³ 个顶点的有向图,顶点坐标标记为 ijk,其中 0≦ i, j, k < m。每个顶点发出三条弧,分别指向 i⁺jk、ij⁺k 和 ijk⁺,这里的加号代表加1后对 m 取模。最终目标是找到一种通用方法,将这些弧分解成三个长度为 m³ 的有向环,并且该方法需适用于所有 m>2 的情况。

高德纳此前已解决了 m=3 的基础情形,并将其用作书中的一道练习题。他的朋友 Filip Stappers 随后通过实验发现了 4≦ m≦16 的解,这大大增强了此类分解法普遍存在的可能性。为了探寻通用解法,Stappers 将这个问题完整地提交给了 Claude 处理。

31步探索:AI 的解题路径

在交互过程中,Stappers 为 Claude 设定了严格的指令规则:

• 在运行任何测试代码后,必须立刻更新 plan.md 文件。

• 在完整记录当前步骤之前,绝对不允许开启下一步的探索。

Claude 尝试了多种数学工具。它起初测试了简单的线性与二次函数,但均未奏效。接着,它尝试使用暴力深度优先搜索,最终因搜索空间过于庞大而放弃。随后,它引入了「2D 蛇形分析」,并准确识别出该有向图是一个带有两个生成元的凯莱图(Cayley digraph)。

问题的转机出现在探索的后半程:

• 在第15次探索时,Claude 引入了「纤维分解」的框架,将问题转化为在坐标上选择算子的排列组合问题。

• 在第25次探索之后,它自主得出结论:模拟退火算法虽能找到具体解,但无法给出通用的构造方法,这时需要纯粹的数学推导。

• 最终,在第31次探索时,Claude 注意到每个纤维的选择仅依赖于单一坐标,并据此给出了一个具体的 Python 构造程序,成功地为 m=3, 5, 7, 9, 11 生成了完美的分解方案。

(此处为简化版的 Python 程序,用 C 语言形式写的示例图片)

严谨的数学证明与偶数域的挑战

获得构造代码仅仅是第一步。Stappers 验证了从3到101之间的所有奇数 m,均得到了完美的分解方案。随后,高德纳接手进行了严谨的数学证明。他详细推导出,生成的第一个环包含了所有具备相同特征的 m² 个顶点,从而证实其长度确为 m³,是一个货真价实的哈密顿环。

高德纳进一步研究发现,在所有类似 Claude 生成逻辑的分解法中,恰好有760种能对所有奇数 m>1 有效。Claude 凭借自身的推导,准确地找到了其中之一。

目前,偶数 m 的情况依然悬而未决。

• Claude 在探索中曾找到 m=4, 6, 8 的解,但未能发现其中蕴含的通用规律。

• 当被要求继续攻克偶数情形时,Claude 陷入困境,后续甚至无法正确编写探索程序。

• 另一位研究者 Ho Boon Suan 借助 gpt-5.3-codex 生成了处理大于8的偶数 m 的代码,并在高达 m=2000 的规模下测试成功。

• 但由于其模式过于复杂,目前依靠人工证明其正确性难度极大。

在 Hacker News 和 Reddit 等技术社区,开发者们普遍认为,此次事件的核心意义在于,AI 在数学辅助证明中展现出了自主更换探索工具、排除无效路径的能力。

正如高德纳在文末感慨的那样,克劳德·香农(Claude Shannon)在天之灵若能知晓他的名字与这样的进步联系在一起,定会感到无比骄傲。

Hats off to Claude!

AI 进军数学殿堂:从竞赛夺金到前沿探索

高德纳的惊叹并非个例。实际上,在过去一年多的时间里,AI 在解决复杂数学和逻辑问题上已取得了多个具有实质性意义的突破。

• 国际奥数突破: 2025年7月,Google DeepMind 发布的 Gemini(Deep Think 模式)在国际数学奥林匹克(IMO)试题评测中达到金牌标准,获得35分,并能在接近正式考试的条件下输出完整的自然语言证明。与此同时,OpenAI 也披露其内部模型达到了类似水平,但官方认证与评测细节相对有限。

• 编程竞赛能力跃升: 2025年9月,OpenAI 和 Gemini 都宣称达到了国际大学生程序设计竞赛(ICPC)金牌水平,能在严格时间限制内解决高难度算法问题。不过,这些成绩主要源于平行测试或基准评估,并非以正式参赛身份获得官方金牌。

• 从解题到科研协作: 如今,AI 在科研中的角色显著增强。模型开始借助外部工具参与数学研究与问题验证,在复杂猜想与定理探索中发挥辅助作用。例如,GPT-5.2 借助外部工具,协助数学家解决了数个悬而未决的 Erdős 猜想,并得到了著名数学家陶哲轩的验证。部分系统已展现出生成研究草稿与进行结构化推理的能力。

驱动这些突破的核心机制也发生了改变。AI 开始减少对单次快速生成的依赖。现在的模型普遍采用「测试时计算扩展」或「慢思考」策略。通过在推理阶段投入更多算力,模型能够并行探索多条解题路径并进行严格的自我验证。

展望未来,AI 与数学的结合将突破封闭环境下的标准化考题。随着自然语言理解力与形式化逻辑的深度融合,AI 将成为数学家与工程师身边得力的合作者,帮助人类共同攻克那些停滞多年的科学难题。


————  END  ————


灵思极智旗下“极智系列”三款AI智能应用

图片




灵思极智让AI为各行业赋能
打造[超级企业]+[超级个体]
“让人回归人的价值”!
用灵思,创极智!点击关注“灵思极智”
图片


关注后,两步置顶服务号,可第一时间收到灵思极智推文!

图片

【声明】内容源于网络
0
0
灵思极智
AI领域超级创造工厂,用灵思,创极智!
内容 176
粉丝 0
灵思极智 AI领域超级创造工厂,用灵思,创极智!
总阅读135
粉丝0
内容176