AI數學革命2026：80年埃爾德什難題被破解，人類數學家集體沉默了

2026年夏天，數學界發生了一件足以寫入教科書的事情。

不是某個天才數學家在黑板上寫下了完美的證明，也不是某個實驗室裡的大型對撞機發現了新粒子——而是一段AI生成的數學證明，推翻了一個困擾人類80年的猜想。

這場革命的震撼程度，連最保守的數學家都不得不承認：人類數學的邊界，正在被重新定義。

什麼是埃爾德什難題？

要理解這場革命的分量，先要認識一個人——保羅·埃爾德什（Paul Erdős）。

他是20世紀最多產的數學家之一，一生發表了超過1,500篇論文，與500多位合作者共同研究。他提出了無數未解猜想，其中許多以他的名字命名——「埃爾德什難題」、「埃爾德什和問題」。

1946年，埃爾德什提出了一個關於單位距離的猜想：在平面上放置任意多個點，最少會有多少對點之間恰好相距一個單位距離？

這個問題聽起來簡單，但從那以後的80年間，最頂尖的數學家們無人能完全破解。

兩次革命：OpenAI 和 DeepMind 同時出手

2026年，AI在數學領域的突破不是單點的，而是雙線並進。

第一波：OpenAI 破解單位距離難題

OpenAI 的一個通用推理模型（不是專門訓練數學的，純靠邏輯推理能力），獨立破解了埃爾德什1946年提出的單位距離難題。

最炸裂的不是結果，而是方法。

這個模型沒有使用人類數學家過去80年一直在試的正方形網格方法，而是從代數數論裡「借」了一把武器——搬出了無限類域塔和Golod-Shafarevich理論。

用一位數學家比喻的話：「這相當於一個計算機工程師，用古漢語語法去破解了物理學方程。」思路之偏門、之巧妙，連數學家都驚了。

費爾茲獎得主高爾斯（Fields Medalist）評價道：「如果這是人寫的論文，我會毫不猶豫建議頂刊接收。」

更令人震驚的是，這位數學家 Thomas Bloom 之前曾拆穿過 OpenAI 的一次失敗嘗試——去年 GPT-5 號稱解了10個埃爾德什問題，結果被證明是在搜索論文。但這次，他說了完全不同的話：

「這是 AI 目前在數學領域取得的最亮眼的成就。」

第二波：DeepMind 的 AI 數學工具一次破解9個

就在 OpenAI 的消息傳出不久，DeepMind 宣布了一個更驚人的成果：他們的 AI 數學工具（Math Harness），使用 LLM 推理 + Lean 形式化驗證器，自主解決了9個重大的埃爾德什未解問題。

這個工具的核心創新在於：

1. LLM 生成猜想和證明思路

2. Lean 形式化驗證器即時檢查每一步

3. 自我反饋循環：如果驗證失敗，LLM 自動調整策略

這意味著 AI 不僅能「猜」答案，還能「證」答案——而且保證證明沒有漏洞。

Polymarket 數據顯示，這個消息一出，相關預測市場的成交量瞬間暴增，超過200萬次瀏覽。

第三個故事：23歲門外漢用 ChatGPT 破了60年難題

除了 OpenAI 和 DeepMind，還有一個更出人意料的故事。

23歲的業餘數學愛好者 Liam Price，只是一個 ChatGPT Pro 訂閱用戶，在一個百無聊賴的週一下午，把一道來自專門收錄埃爾德什問題的網站上的題目輸入給了 GPT-5.4 Pro。

他只用了5條大白話提示詞：

別聯網
你當研究者
我把問題說清楚
前人路徑全給你
可能需要新方法，別被框住

80分鐘後，AI吐出了一個看起來極其靠譜的正確解法。

Price 把結果發給了他在劍橋大學讀數學大二的搭檔 Kevin Barreto。Barreto 看到信息後，立刻意識到這次的發現非同小可。

陶哲軒一看，恍然大悟：原來過去所有研究這道題的人類，一上來就習慣性地用同一套標準動作起手，結果集體在第一步就走偏了。

而 AI 沒有這種人類的「思維包袱」。它另闢蹊徑，巧妙地借用了一個在其他數學相關領域廣為人知、卻從未有人想過要應用在這類問題上的公式，硬生生蹚出了一條新路。

斯坦福大學數學家 Jared Lichtman 坦言：「ChatGPT 輸出的原始證明其實質量很差，需要像我和陶哲軒這樣的頂尖專家像淘金一樣，在龐雜的輸出中梳理、理解它的真實意圖，並最終對證明進行精簡。」

為什麼人類80年解不出來？

這是一個值得深思的問題。

1. 專業化陷阱

現代數學已經變得極度專精。一個數學家一輩子可能只研究一個小領域。DeepMind 的研究人員指出：「這種跨領域的工具遷移正是人類研究者最難做到的——因為人類在數學裡普遍超專業化，看不見遠緣領域的工具。」

而 AI 不受此限。它讀過所有領域的文獻，可以隨時調用任何數學分支的工具。

2. 思維慣性

Price 的提示詞中有一句最关键：「前人路徑全給你」。這意味著 AI 知道人類走了80年的錯誤方向，然後直接跳過了那個死胡同。

數學家陶哲軒的評論最為精準：「60年的數學家，輸給了一個會問 AI 的普通人。」

3. 驗證與創造的混淆

傳統數學研究把「猜測方向」和「嚴格證明」混在一起。AI 的做法是先讓 LLM 大膽猜測，再用 Lean 嚴格的驗證器逐一檢驗——這套「先放後收」的策略，人類數學家反而不太擅長。

這意味著什麼？

對數學界來說：AI 不是「輔助工具」，而是「合作研究者」。它不只在計算上更快，而是在創意層面提供了人類想不到路徑。 對科學研究來說：如果 AI 能在數學這種最需要抽象思維的領域取得突破，那麼物理、生物、材料科學呢？Noam Brown（OpenAI 研究員）說這個模型「很快將人人可用」。如果過兩個月，你手機裡的 AI 就能做前沿科研了——那科研的門檻還叫門檻嗎？ 對投資和產業來說：這標誌著一個新的時代——AI 原生科學研究。那些將 AI 深度整合到基礎科學研究的公司和機構，將獲得巨大的領先優勢。

冷靜的聲音：不要過度宣傳

儘管成就驚人，數學界也保持了必要的冷靜。

Hacker News 上多位數學家強調：

這是 AI 輔助數學發現的里程碑事件，但不等於「AI 已經能做數學博士的工作」
埃爾德什的猜想極多，被反例推翻的只是其中一個
反例告訴我們「這個猜想錯了」，但不告訴我們應該往哪個新方向修正
如果 AI 能反过来先猜測一個新命題再給出證明，那才是真正的下一步

Reddit r/math 上有一句自嘲：「我們可能快要失業了，但至少 AI 讓我們找到了新方向。」

未來展望：AI 時代的數學

2026年的這一連串突破，標誌著數學研究進入了一個全新紀元。

未來的數學研究可能長這樣：

1. 人類提出問題和直覺

2. AI 生成多種可能的證明路徑

3. 形式化驗證器即時檢驗

4. 人類專家提煉和簡化

5. 新的猜想和問題被提出

6. 循環往復，加速推進

這不是 AI 取代數學家，而是人機協作的新范式。

就像望遠鏡沒有取代天文學家，而是讓他們看得更遠；AI 不會取代數學家，而是讓他們想得更深。

80年的難題被破解了。但這僅僅是開始。

本文素材來源：OpenAI 官方公告、DeepMind Math Harness 論文（arxiv.org/abs/2605.22763）、小紅書量子位、肥豬豬左衛門、De同學、雅桑了嗎、Twitter @Polymarket @grok @scottlincicome、Hacker News 討論

Jianm's Blog

搜尋此網誌