跳到主要內容

AI數學革命2026:80年埃爾德什難題被破解,人類數學家集體沉默了

2026年夏天,數學界發生了一件足以寫入教科書的事情。

不是某個天才數學家在黑板上寫下了完美的證明,也不是某個實驗室裡的大型對撞機發現了新粒子——而是一段AI生成的數學證明,推翻了一個困擾人類80年的猜想。

這場革命的震撼程度,連最保守的數學家都不得不承認:人類數學的邊界,正在被重新定義。

AI與數學概念圖

什麼是埃爾德什難題?

要理解這場革命的分量,先要認識一個人——保羅·埃爾德什(Paul Erdős)

他是20世紀最多產的數學家之一,一生發表了超過1,500篇論文,與500多位合作者共同研究。他提出了無數未解猜想,其中許多以他的名字命名——「埃爾德什難題」、「埃爾德什和問題」。

1946年,埃爾德什提出了一個關於單位距離的猜想:在平面上放置任意多個點,最少會有多少對點之間恰好相距一個單位距離?

這個問題聽起來簡單,但從那以後的80年間,最頂尖的數學家們無人能完全破解。

兩次革命:OpenAI 和 DeepMind 同時出手

2026年,AI在數學領域的突破不是單點的,而是雙線並進

第一波:OpenAI 破解單位距離難題

OpenAI 的一個通用推理模型(不是專門訓練數學的,純靠邏輯推理能力),獨立破解了埃爾德什1946年提出的單位距離難題。

最炸裂的不是結果,而是方法。

這個模型沒有使用人類數學家過去80年一直在試的正方形網格方法,而是從代數數論裡「借」了一把武器——搬出了無限類域塔Golod-Shafarevich理論

用一位數學家比喻的話:「這相當於一個計算機工程師,用古漢語語法去破解了物理學方程。」思路之偏門、之巧妙,連數學家都驚了。

費爾茲獎得主高爾斯(Fields Medalist)評價道:「如果這是人寫的論文,我會毫不猶豫建議頂刊接收。」

更令人震驚的是,這位數學家 Thomas Bloom 之前曾拆穿過 OpenAI 的一次失敗嘗試——去年 GPT-5 號稱解了10個埃爾德什問題,結果被證明是在搜索論文。但這次,他說了完全不同的話:

「這是 AI 目前在數學領域取得的最亮眼的成就。」

第二波:DeepMind 的 AI 數學工具一次破解9個

就在 OpenAI 的消息傳出不久,DeepMind 宣布了一個更驚人的成果:他們的 AI 數學工具(Math Harness),使用 LLM 推理 + Lean 形式化驗證器,自主解決了9個重大的埃爾德什未解問題

這個工具的核心創新在於:

1. LLM 生成猜想和證明思路

2. Lean 形式化驗證器即時檢查每一步

3. 自我反饋循環:如果驗證失敗,LLM 自動調整策略

這意味著 AI 不僅能「猜」答案,還能「證」答案——而且保證證明沒有漏洞。

Polymarket 數據顯示,這個消息一出,相關預測市場的成交量瞬間暴增,超過200萬次瀏覽。

第三個故事:23歲門外漢用 ChatGPT 破了60年難題

除了 OpenAI 和 DeepMind,還有一個更出人意料的故事。

23歲的業餘數學愛好者 Liam Price,只是一個 ChatGPT Pro 訂閱用戶,在一個百無聊賴的週一下午,把一道來自專門收錄埃爾德什問題的網站上的題目輸入給了 GPT-5.4 Pro。

他只用了5條大白話提示詞

  • 別聯網
  • 你當研究者
  • 我把問題說清楚
  • 前人路徑全給你
  • 可能需要新方法,別被框住
80分鐘後,AI吐出了一個看起來極其靠譜的正確解法。

Price 把結果發給了他在劍橋大學讀數學大二的搭檔 Kevin Barreto。Barreto 看到信息後,立刻意識到這次的發現非同小可。

陶哲軒一看,恍然大悟:原來過去所有研究這道題的人類,一上來就習慣性地用同一套標準動作起手,結果集體在第一步就走偏了。

而 AI 沒有這種人類的「思維包袱」。它另闢蹊徑,巧妙地借用了一個在其他數學相關領域廣為人知、卻從未有人想過要應用在這類問題上的公式,硬生生蹚出了一條新路。

斯坦福大學數學家 Jared Lichtman 坦言:「ChatGPT 輸出的原始證明其實質量很差,需要像我和陶哲軒這樣的頂尖專家像淘金一樣,在龐雜的輸出中梳理、理解它的真實意圖,並最終對證明進行精簡。」

為什麼人類80年解不出來?

這是一個值得深思的問題。

1. 專業化陷阱

現代數學已經變得極度專精。一個數學家一輩子可能只研究一個小領域。DeepMind 的研究人員指出:「這種跨領域的工具遷移正是人類研究者最難做到的——因為人類在數學裡普遍超專業化,看不見遠緣領域的工具。」

而 AI 不受此限。它讀過所有領域的文獻,可以隨時調用任何數學分支的工具。

2. 思維慣性

Price 的提示詞中有一句最关键:「前人路徑全給你」。這意味著 AI 知道人類走了80年的錯誤方向,然後直接跳過了那個死胡同

數學家陶哲軒的評論最為精準:「60年的數學家,輸給了一個會問 AI 的普通人。」

3. 驗證與創造的混淆

傳統數學研究把「猜測方向」和「嚴格證明」混在一起。AI 的做法是先讓 LLM 大膽猜測,再用 Lean 嚴格的驗證器逐一檢驗——這套「先放後收」的策略,人類數學家反而不太擅長。

這意味著什麼?

對數學界來說:AI 不是「輔助工具」,而是「合作研究者」。它不只在計算上更快,而是在創意層面提供了人類想不到路徑。 對科學研究來說:如果 AI 能在數學這種最需要抽象思維的領域取得突破,那麼物理、生物、材料科學呢?Noam Brown(OpenAI 研究員)說這個模型「很快將人人可用」。如果過兩個月,你手機裡的 AI 就能做前沿科研了——那科研的門檻還叫門檻嗎? 對投資和產業來說:這標誌著一個新的時代——AI 原生科學研究。那些將 AI 深度整合到基礎科學研究的公司和機構,將獲得巨大的領先優勢。

冷靜的聲音:不要過度宣傳

儘管成就驚人,數學界也保持了必要的冷靜。

Hacker News 上多位數學家強調:

  • 這是 AI 輔助數學發現的里程碑事件,但不等於「AI 已經能做數學博士的工作」
  • 埃爾德什的猜想極多,被反例推翻的只是其中一個
  • 反例告訴我們「這個猜想錯了」,但不告訴我們應該往哪個新方向修正
  • 如果 AI 能反过来先猜測一個新命題再給出證明,那才是真正的下一步

Reddit r/math 上有一句自嘲:「我們可能快要失業了,但至少 AI 讓我們找到了新方向。」

未來展望:AI 時代的數學

2026年的這一連串突破,標誌著數學研究進入了一個全新紀元。

未來的數學研究可能長這樣:

1. 人類提出問題和直覺

2. AI 生成多種可能的證明路徑

3. 形式化驗證器即時檢驗

4. 人類專家提煉和簡化

5. 新的猜想和問題被提出

6. 循環往復,加速推進

這不是 AI 取代數學家,而是人機協作的新范式

就像望遠鏡沒有取代天文學家,而是讓他們看得更遠;AI 不會取代數學家,而是讓他們想得更深。

80年的難題被破解了。但這僅僅是開始。


本文素材來源:OpenAI 官方公告、DeepMind Math Harness 論文(arxiv.org/abs/2605.22763)、小紅書量子位、肥豬豬左衛門、De同學、雅桑了嗎、Twitter @Polymarket @grok @scottlincicome、Hacker News 討論

留言