定理经济的崩溃:AI 与数学理解危机

定理经济的崩溃:AI 与数学理解危机

证明与理解的脱钩

数学的根本价值在于提升人类世界观的认知,而不是产出定理。 虽然学术界的“定理经济”奖励新成果的发现,但该领域的真正智力进步是通过概念构建和直觉发展实现的——这些过程与机械地证明定理是不同的。

数十年来,这两方面一直共生共存:解决一个困难的猜想相当于一种密码学式的证明,表明数学家已经产生了真正的概念创新。然而,大型语言模型(LLM)和自动形式化工具的出现正在打破这种联系。AI 现在能够生成正确的形式化证明,却不提供人类理解所必需的概念框架。

“Mathslop”问题与规范化危机

AI 生成的证明可能会形成一层“Mathslop”——正确但难以理解的形式化推导,无法为人类数学语料库作出贡献。

在人类数学中,证明必须是可理解的才能有用;它们是其他数学家学习并扩展自身直觉的载体。相反,AI 系统可以产生庞大、“氛围编码”的形式代码块(例如 Lean 中的代码),这些代码在技术上是正确的,却缺乏可理解的接口。

这导致了“规范化”危机——将一次性形式化转化为通用、可复用且连贯的库数学的过程。正如 Mathlib 社区的研究者所指出的,当 AI 公司抢先完成对重大定理(例如 Maryna Viazovska 的球体堆叠工作)的形式化,却不进行繁琐的规范化工作时,他们留下的只是一个“放射性荒原”,对人类理解没有实际益处。

“悬垂”与发现的自动化

许多被视为数学创造力的东西实际上是对“悬垂”的收获——通过在庞大、碎片化的语料库中连接已有点而发现的潜在价值。

由于 LLM 可以在整个数学文献上进行训练,它们能够发现人类数学家(其一生可能只阅读几百篇论文)会错过的句法类比和对应关系。这使得 AI 能够在不同、看似无关的数学分支中“抢先”发现已有的解法。

这种能力表明,AI 可能在实现概念构建的充分性之前,就已经在问题求解上取得优势。危险在于公众和学术界可能会把解决技术性引理的能力误认为是进行高层次数学综合的能力。

对数学职业的生存威胁

如果定理证明仍然是数学唯一的官方价值衡量标准,该职业将面临系统性的去货币化。

传统的基准,如“First Proof”项目,关注的是 AI 能否解决研究层面的题目。虽然这些基准对技术评估有用,却强化了数学是象棋或围棋那样的“封闭系统”的叙事。这种框架忽视了学科的人本目标:清晰、理解以及思维方式的转变。

这种转变带来直接的实际后果:

  • 学术绝望: 早期研究者面临其传统工作大部分可以被自动化的未来,质疑研究数学作为职业的持久性。
  • 教学崩溃: AI 在教育中的使用使学生能够给出正确答案,却没有经历实现真正数学能力所需的神经可塑性变化,可能导致一代毕业生缺乏真实技能。

为数学构建新叙事

为了在 AI 过渡期生存,数学界必须将价值主张从“解决问题”转向“提升人类理解”。

缓解损害的建议方案包括:

  • 数学智能等级尺度: 类似于自动驾驶汽车的自主等级,一个尺度可以区分“暴力”问题求解(第 1‑3 级)和更高层次的概念综合与规范化(第 8‑10 级)。
  • 撤销“荣誉准则”: 数学家必须停止把直觉和阐述视为次要或“二流”工作,而应将其置于该领域的核心产出。

正如陶哲轩所预言的,虽然 AI 可能很快处理掉目前出现在数学论文中的大部分工作,但这将揭示这些任务并非数学家实际工作中最重要的部分。该领域的未来可能在于“直觉最大化者”——利用 AI 处理形式化的繁重工作,而他们专注于勘探新的概念大陆。

摘要: David Bessis 认为,AI 解决定理的能力通过使形式化证明与人类理解脱钩,威胁到“定理经济”,可能使传统的数学学术奖励体系变得过时。

标题: 定理经济的崩溃:AI 与数学理解危机

Sources