AI 正在改变数学:从 IMO 竞赛到研究级证明,拐点已至
作为 OfoxAI(ofox.ai)的开发者,我每天都在和不同的 AI 模型打交道。但最近 Quanta Magazine 的一篇深度报道让我意识到,AI 的能力边界正在一个我没太关注的领域被彻底重新定义 —— 数学。
2025 年夏天:拐点
2025 年 7 月,多个 AI 模型在国际数学奥林匹克竞赛(IMO)中解出了 6 道题中的 5 道。这本身已经够震撼了,但真正的转折不在竞赛 —— 而是那些原本对 AI 嗤之以鼻的数学家们开始亲自上手试用,然后发现:这东西不只是会做题,它能帮你做真正的研究。
插图来源:Nash Weerasekera / Quanta Magazine
陶哲轩(Terence Tao),菲尔兹奖得主,UCLA 数学教授,可能是目前最积极拥抱 AI 的顶级数学家。他的评价很直接:”2025 年是 AI 真正开始在很多不同任务上变得有用的一年。”
AlphaEvolve:用遗传算法进化数学程序
2025 年初,陶哲轩和 Brown 大学的 Gómez-Serrano 与 DeepMind 的两位数学家合作,开发了一个叫 AlphaEvolve 的系统。它的工作方式很有意思:
- 用 Gemini 生成可能长达数百行的 Python 程序
- 通过遗传算法不断”进化”这些程序
- 尝试找到数学问题的最优解
他们在几个月内对 67 个不同领域的数学问题进行了测试。结果:23 个问题上超越了已知最优解,36 个持平,只有少数几个没达到最优。
陶哲轩,图片来源:Reed Hutchinson / UCLA
一个有趣的发现:模型似乎对”鼓励”有反应。当 prompt 中加入”You can do this”这样的正面强化时,表现会更好。研究者自己也说”不知道为什么”。这让我想到,我们对 LLM 的理解还远远不够。
First Proof 挑战:研究生毕业了
如果说 IMO 是 AI 进入大学数学系的时刻,那 2026 年 2 月的 First Proof 挑战就是它拿到研究生学位的时刻。
这个挑战给参赛者一周时间,让 AI 模型解决 10 个研究级别的数学问题 —— 这些问题被精心挑选,不太可能出现在训练数据中。结果,模型成功解决了超过一半的问题。
多伦多大学的 Daniel Litt 在分析结果时写道:”这项技术很可能比计算机本身更重要。”
这意味着什么
陶哲轩指出了一个根本性的变化:以前数学家一次研究一个问题,现在”用这些工具你可以同时解决数千个问题,开始做统计研究”。数学的工作方式本身在改变。
但也有谨慎的声音。同为菲尔兹奖得主的 Akshay Venkatesh 提醒:”我们文化中有一些有价值的东西应该努力保留。” 当 AI 变成强大的新工具时,数学家可能会失去对数学理解的直接体验。
这个担忧不只属于数学界。作为开发者,我们也在经历类似的张力 —— AI 让我们更高效,但”理解”和”使用”之间的鸿沟在加大。
我的看法
几个值得关注的信号:
人才流动方向变了。 数学家正在离开学术界,加入 OpenAI、Google,或者 Harmonic、Math Inc. 这样的 AI 数学创业公司。Carnegie Mellon 的 Jeremy Avigad 说得好:”人们正在认识到,通往通用智能的关键是将机器学习的洞察力与数学的精确性结合起来。”
工具改变思维方式。 这不是”AI 替代数学家”的故事,而是”AI 改变数学家工作方式”的故事。就像 IDE 改变了程序员写代码的方式,AI 正在改变数学家做研究的方式。
鼓励有用。 给 LLM 说”你能行”居然能提升表现,这件事本身就说明我们对这些模型的运作机制理解得有多浅。在 prompt engineering 这条路上,我们可能才走了 10%。
数学是人类智力活动中最纯粹、最抽象的领域之一。如果 AI 能在这里产生实质性影响,那它在其他领域的潜力只会更大。2025 是拐点,2026 是加速期。值得持续关注。
素材来源:Quanta Magazine - The AI Revolution in Math Has Arrived
