【灵思发现】图灵奖得主高德纳惊呼：「不可思议！不可思议！」Claude攻克算法经典难题- 大数跨境

首页

【灵思发现】图灵奖得主高德纳惊呼：「不可思议！不可思议！」Claude攻克算法经典难题

灵思极智

2026-03-11

导读：谷歌 Nano Banana 2 一夜之间补齐短板，各类图解信手拈来，定价仅为 OpenAI 一半

「不可思议！不可思议！」

究竟是什么让享誉世界的计算机科学家、数学巨匠、《计算机程序设计艺术》的作者、图灵奖得主高德纳（Donald Knuth）发出了如此感慨？

您猜得没错，正是人工智能。

在他近期发布于斯坦福大学官网的论文《Claude’s Cycles》中，开篇便用了「Shock! Shock!」这样直白的词汇，毫不掩饰地表达了他对人工智能展现出的强大能力的震撼。

紧接着他在文中写道：「昨日我得知，一个我钻研了数周的开放式问题，刚刚被 Claude Opus 4.6——Anthropic 公司三周前发布的混合推理模型——成功解决了！看来，我需要在某个时间点重新评估我对『生成式AI』的看法了。不仅我的猜想得到了一个相当不错的解答，而且这标志着自动推理与创造性问题解决领域的一次巨大飞跃，这确实是一件令人欣喜的事。我将在本文中简要叙述这一过程。」

此事迅速引发广泛关注，网友们纷纷发表评论，感叹新时代的开启。

以下是 Hacker News 用户 Ian Danforth 给出的内容概要：高德纳提出一个问题，他的朋友借助 Claude 进行了30多次尝试，在人类的精细指导下，Claude 最终编写出一个 Python 程序，成功为所有奇数情况找到了解。高德纳随后为这个方法撰写了证明，并对 Claude 的贡献感到非常满意。至于偶数情况，目前仍是未解之谜（Claude 在此方向上进展有限）。

困扰学术泰斗的图论挑战

高德纳在为《计算机程序设计艺术》未来卷撰写关于有向哈密顿环的内容时，遇到了一个棘手的开放性问题。

具体来说，需要研究一个包含 m³ 个顶点的有向图，顶点坐标标记为 ijk，其中 0≦ i, j, k < m。每个顶点发出三条弧，分别指向 i⁺jk、ij⁺k 和 ijk⁺，这里的加号代表加1后对 m 取模。最终目标是找到一种通用方法，将这些弧分解成三个长度为 m³ 的有向环，并且该方法需适用于所有 m>2 的情况。

高德纳此前已解决了 m=3 的基础情形，并将其用作书中的一道练习题。他的朋友 Filip Stappers 随后通过实验发现了 4≦ m≦16 的解，这大大增强了此类分解法普遍存在的可能性。为了探寻通用解法，Stappers 将这个问题完整地提交给了 Claude 处理。

31步探索：AI 的解题路径

在交互过程中，Stappers 为 Claude 设定了严格的指令规则：

• 在运行任何测试代码后，必须立刻更新 plan.md 文件。

• 在完整记录当前步骤之前，绝对不允许开启下一步的探索。

Claude 尝试了多种数学工具。它起初测试了简单的线性与二次函数，但均未奏效。接着，它尝试使用暴力深度优先搜索，最终因搜索空间过于庞大而放弃。随后，它引入了「2D 蛇形分析」，并准确识别出该有向图是一个带有两个生成元的凯莱图（Cayley digraph）。

问题的转机出现在探索的后半程：

• 在第15次探索时，Claude 引入了「纤维分解」的框架，将问题转化为在坐标上选择算子的排列组合问题。

• 在第25次探索之后，它自主得出结论：模拟退火算法虽能找到具体解，但无法给出通用的构造方法，这时需要纯粹的数学推导。

• 最终，在第31次探索时，Claude 注意到每个纤维的选择仅依赖于单一坐标，并据此给出了一个具体的 Python 构造程序，成功地为 m=3, 5, 7, 9, 11 生成了完美的分解方案。

（此处为简化版的 Python 程序，用 C 语言形式写的示例图片）

严谨的数学证明与偶数域的挑战

获得构造代码仅仅是第一步。Stappers 验证了从3到101之间的所有奇数 m，均得到了完美的分解方案。随后，高德纳接手进行了严谨的数学证明。他详细推导出，生成的第一个环包含了所有具备相同特征的 m² 个顶点，从而证实其长度确为 m³，是一个货真价实的哈密顿环。

高德纳进一步研究发现，在所有类似 Claude 生成逻辑的分解法中，恰好有760种能对所有奇数 m>1 有效。Claude 凭借自身的推导，准确地找到了其中之一。

目前，偶数 m 的情况依然悬而未决。

• Claude 在探索中曾找到 m=4, 6, 8 的解，但未能发现其中蕴含的通用规律。

• 当被要求继续攻克偶数情形时，Claude 陷入困境，后续甚至无法正确编写探索程序。

• 另一位研究者 Ho Boon Suan 借助 gpt-5.3-codex 生成了处理大于8的偶数 m 的代码，并在高达 m=2000 的规模下测试成功。

• 但由于其模式过于复杂，目前依靠人工证明其正确性难度极大。

在 Hacker News 和 Reddit 等技术社区，开发者们普遍认为，此次事件的核心意义在于，AI 在数学辅助证明中展现出了自主更换探索工具、排除无效路径的能力。

正如高德纳在文末感慨的那样，克劳德·香农（Claude Shannon）在天之灵若能知晓他的名字与这样的进步联系在一起，定会感到无比骄傲。

Hats off to Claude!

AI 进军数学殿堂：从竞赛夺金到前沿探索

高德纳的惊叹并非个例。实际上，在过去一年多的时间里，AI 在解决复杂数学和逻辑问题上已取得了多个具有实质性意义的突破。

• 国际奥数突破： 2025年7月，Google DeepMind 发布的 Gemini（Deep Think 模式）在国际数学奥林匹克（IMO）试题评测中达到金牌标准，获得35分，并能在接近正式考试的条件下输出完整的自然语言证明。与此同时，OpenAI 也披露其内部模型达到了类似水平，但官方认证与评测细节相对有限。

• 编程竞赛能力跃升： 2025年9月，OpenAI 和 Gemini 都宣称达到了国际大学生程序设计竞赛（ICPC）金牌水平，能在严格时间限制内解决高难度算法问题。不过，这些成绩主要源于平行测试或基准评估，并非以正式参赛身份获得官方金牌。

• 从解题到科研协作：如今，AI 在科研中的角色显著增强。模型开始借助外部工具参与数学研究与问题验证，在复杂猜想与定理探索中发挥辅助作用。例如，GPT-5.2 借助外部工具，协助数学家解决了数个悬而未决的 Erdős 猜想，并得到了著名数学家陶哲轩的验证。部分系统已展现出生成研究草稿与进行结构化推理的能力。

驱动这些突破的核心机制也发生了改变。AI 开始减少对单次快速生成的依赖。现在的模型普遍采用「测试时计算扩展」或「慢思考」策略。通过在推理阶段投入更多算力，模型能够并行探索多条解题路径并进行严格的自我验证。

展望未来，AI 与数学的结合将突破封闭环境下的标准化考题。随着自然语言理解力与形式化逻辑的深度融合，AI 将成为数学家与工程师身边得力的合作者，帮助人类共同攻克那些停滞多年的科学难题。

———— END ————

灵思极智旗下“极智系列”三款AI智能应用