亚洲欧美日韩精品,亚洲成aⅴ人片在线影院八,国产1024一区二区你懂的,欧美毛片一级的免费的

首頁(yè) > 實(shí)用技巧 > 干貨教程 > AI成為數(shù)學(xué)家得力助手還要多久

AI成為數(shù)學(xué)家得力助手還要多久

發(fā)布時(shí)間:2025-06-17 17:41:41

從計(jì)算機(jī)科學(xué)到醫(yī)學(xué)再到國(guó)家安全,數(shù)學(xué)是眾多關(guān)鍵應(yīng)用的基石,但數(shù)學(xué)領(lǐng)域的進(jìn)步可能需要數(shù)年時(shí)間才能實(shí)現(xiàn)。

幾百年來(lái),數(shù)學(xué)家使用的工具依然簡(jiǎn)樸:一張紙、一支筆。他們憑借邏輯與靈感,在符號(hào)的迷宮中尋找通往真理的路徑。

為了打破這一局面,美國(guó)國(guó)防高級(jí)研究計(jì)劃局今年4月啟動(dòng)了“指數(shù)性數(shù)學(xué)”計(jì)劃,旨在開(kāi)發(fā)一種能極大提升數(shù)學(xué)研究效率的人工智能(AI)“合著者”系統(tǒng)。

幾十年來(lái),數(shù)學(xué)家借助計(jì)算機(jī)進(jìn)行輔助計(jì)算或驗(yàn)證命題,如今的AI或許能更上層樓,挑戰(zhàn)那些人類長(zhǎng)年未解的難題。不過(guò),從能解高中題的AI,到能協(xié)助攻克前沿?cái)?shù)學(xué)難關(guān)的AI,中間仍隔著一道鴻溝。

解決重大難題仍力不從心

大型語(yǔ)言模型(LLM)并不擅長(zhǎng)數(shù)學(xué)。它們常常出現(xiàn)“幻覺(jué)”,甚至可能被誤導(dǎo)相信2+2=5。但新一代大型推理模型,如OpenAI的o3、Anthropic的Claude 4 Thinking等,展現(xiàn)出的進(jìn)步令數(shù)學(xué)家眼前一亮。

今年,這些模型在美國(guó)數(shù)學(xué)邀請(qǐng)賽中的表現(xiàn)接近優(yōu)秀高中生水平。不同于過(guò)去“一錘定音”式的輸出,這些模型開(kāi)始嘗試模擬數(shù)學(xué)家逐步推理的思考過(guò)程。

同時(shí),一些將LLM與某種事實(shí)核查系統(tǒng)相結(jié)合的新型混合模型也取得了突破。例如,谷歌“深度思維”的AlphaProof系統(tǒng)將語(yǔ)言模型與棋類AI——AlphaZero結(jié)合,成為首個(gè)取得與國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽銀牌得主成績(jī)相當(dāng)?shù)南到y(tǒng)。今年5月,谷歌的AlphaEvolve模型更進(jìn)一步,在多個(gè)長(zhǎng)期未解的數(shù)學(xué)與計(jì)算難題上找到優(yōu)于人類現(xiàn)有方案的解法。

美國(guó)《麻省理工科技評(píng)論》指出,盡管這些AI成績(jī)亮眼,但專家們普遍認(rèn)為,它們?nèi)圆痪邆湔嬲膮f(xié)助科研的能力。競(jìng)賽題雖難,卻更像是智力游戲,有一定“套路”。真正的數(shù)學(xué)研究則更開(kāi)放、更復(fù)雜。面對(duì)“P vs NP”“黎曼猜想”等重大難題時(shí),AI仍力不從心。

為了更準(zhǔn)確地評(píng)估AI的能力,初創(chuàng)公司Epoch AI去年推出了FrontierMath測(cè)試,聯(lián)合60多位數(shù)學(xué)家設(shè)計(jì)出全新高難度題目,避開(kāi)模型已見(jiàn)過(guò)的訓(xùn)練數(shù)據(jù),結(jié)果LLM幾乎集體“交白卷”。

這些測(cè)試表明,AI在數(shù)學(xué)道路上雖已邁步,但離“合著者”角色仍有很長(zhǎng)一段路要走。

需攻克“超長(zhǎng)推理鏈”

仔細(xì)觀察數(shù)學(xué)問(wèn)題會(huì)發(fā)現(xiàn),它們?cè)谀承┓矫骖愃疲航鉀Q問(wèn)題需完成一系列連續(xù)步驟,關(guān)鍵在于找到這些步驟。

美國(guó)加州理工學(xué)院謝爾蓋·古科夫指出,困難的差異往往體現(xiàn)在路徑的長(zhǎng)度上。高中數(shù)學(xué)可能只需10到40步,而像黎曼猜想這樣的難題,路徑可能長(zhǎng)達(dá)百萬(wàn)步。

這類“超長(zhǎng)路徑”極難處理。就像下圍棋時(shí)尋找一條制勝序列,AI必須在指數(shù)級(jí)增長(zhǎng)的可能路徑中找到正確解法。而在數(shù)學(xué)中,這個(gè)復(fù)雜度要遠(yuǎn)超棋類游戲。

據(jù)物理學(xué)家組織網(wǎng)今年2月報(bào)道,為應(yīng)對(duì)這一挑戰(zhàn),古科夫團(tuán)隊(duì)開(kāi)發(fā)了一種方法,將多個(gè)步驟打包成“超級(jí)步驟”,相當(dāng)于穿上“巨人靴”跨越大段路程。他們?cè)O(shè)計(jì)了一個(gè)系統(tǒng),其中強(qiáng)化學(xué)習(xí)模型負(fù)責(zé)提出超級(jí)步驟,另一個(gè)模型負(fù)責(zé)驗(yàn)證其合理性。

該策略在經(jīng)典未解難題——安德魯斯-柯蒂斯猜想上取得了突破。雖然尚未證明或推翻該猜想,但借助AI,科學(xué)家推翻了一個(gè)40年來(lái)被廣泛引用的“反例”。這曾被視為證明該猜想錯(cuò)誤的關(guān)鍵依據(jù)。

牛津大學(xué)數(shù)學(xué)家馬丁·布里森對(duì)此表示肯定:“排除錯(cuò)誤路徑,是科研中非常有價(jià)值的一步。”

古科夫相信,這種“壓縮路徑”的思路適用于所有需要推理鏈條的領(lǐng)域。他希望,這種方法不僅能推動(dòng)AI跳出固有模式,也為數(shù)學(xué)研究帶來(lái)新突破。

真正的創(chuàng)新和突破仍屬人類

跳出思維定式,正是數(shù)學(xué)家攻克難題的關(guān)鍵。數(shù)學(xué)常被看作機(jī)械推理,而高等數(shù)學(xué)則更像是一場(chǎng)實(shí)驗(yàn),充滿一波三折的試錯(cuò)與靈光乍現(xiàn)的頓悟。

這正是AlphaEvolve等AI工具的優(yōu)勢(shì)所在。它通過(guò)LLM不斷生成并改進(jìn)解題代碼,配合第二個(gè)模型評(píng)估每一輪結(jié)果,最終提出比人類更優(yōu)的解法。這種方法不僅能獨(dú)立探索,也支持人類隨時(shí)介入,提供靈感和指令。

澳大利亞悉尼大學(xué)數(shù)學(xué)家喬迪·威廉姆森強(qiáng)調(diào),探索性思維是數(shù)學(xué)的核心。據(jù)英國(guó)《新科學(xué)家》網(wǎng)站報(bào)道,他與Meta合作開(kāi)發(fā)了PatternBoost AI系統(tǒng),可根據(jù)一個(gè)數(shù)學(xué)想法生成相似概念,幫助激發(fā)靈感。他說(shuō):“這就像是這里有一堆有趣的東西,我不知道是怎么回事,但你能再生成一些類似的東西嗎?”

這種頭腦風(fēng)暴在數(shù)學(xué)中至關(guān)重要,它是新想法產(chǎn)生的源泉。以二十面體為例——古希臘人通過(guò)純粹推理發(fā)現(xiàn)了它,其形狀并不存在于自然界中,卻深刻影響了數(shù)學(xué)的發(fā)展。威廉姆森希望,AI未來(lái)也能協(xié)助發(fā)現(xiàn)類似的“新數(shù)學(xué)對(duì)象”。

不過(guò),目前AI仍缺乏真正的創(chuàng)造力。讓AI贏棋是一回事,讓它發(fā)明圍棋游戲則是另一回事。像AlphaEvolve和PatternBoost這樣的工具或許能作為人類直覺(jué)的“偵察兵”,幫助人們發(fā)現(xiàn)路徑、避開(kāi)死路,但專家普遍認(rèn)為,真正的創(chuàng)新與突破,仍然屬于人類。

干貨教程更多>>

上半年銷量穩(wěn)健釋放,雷克薩斯同比正向增長(zhǎng),豐田多品牌協(xié)同展現(xiàn)“抗壓力” 什么是“CDC+空懸”?就是空懸(空氣彈簧)對(duì)車身進(jìn)行“穩(wěn)態(tài)控制”,CDC減振器進(jìn)行“瞬態(tài)控制”,配合使用、共同協(xié)作提升懸架性能 廣汽向自己揮刀,剔除糟粕再談重生 | 茍活這半年 預(yù)售價(jià)32.99萬(wàn)起!猛士M817一車打通城野生活邊界 這個(gè)盛夏7月,L3開(kāi)始重塑智駕格局 32.99萬(wàn)起 猛士M817開(kāi)啟預(yù)售 開(kāi)創(chuàng)中國(guó)豪華智能越野SUV新時(shí)代 特斯拉Model Y六座版下線,加長(zhǎng)15厘米能逆襲嗎? 20萬(wàn)元豪華SUV怎么選?沃爾沃EX30 Cross Country開(kāi)啟越野新體驗(yàn) 72小時(shí)瓦解200億獨(dú)角獸 賈躍亭的法拉第MPV新車亮相 網(wǎng)友:這不就是長(zhǎng)城高山在車頭裝了個(gè)樂(lè)視電視嗎 在流量見(jiàn)頂與用戶爭(zhēng)奪白熱化的當(dāng)下,短劇也已從“營(yíng)銷工具”升級(jí)為電商零售平臺(tái)構(gòu)建生態(tài)壁壘的核心戰(zhàn)場(chǎng)。 曝馬斯克將公司登記為弱勢(shì)小企業(yè) 消息稱幸運(yùn)咖2025年門店目標(biāo)數(shù)1萬(wàn)家,下半年主戰(zhàn)場(chǎng)轉(zhuǎn)向一二線城市 鴻蒙智行問(wèn)界M8純電版SUV全新紫色登場(chǎng),下月發(fā)布 美股英偉達(dá)10萬(wàn)億市值潛力,背后邏輯分析 天才少年21億買票上車,爭(zhēng)奪A股人形機(jī)器人第一股? 第四代長(zhǎng)安CS75PLUS攜王炸配置入市,9.99萬(wàn)起價(jià)重構(gòu)中型燃油SUV市場(chǎng)格局 搭載華為ADS 4/鴻蒙座艙 東風(fēng)猛士M817預(yù)售32.99萬(wàn)起 廣菲克的Jeep走了,但進(jìn)口的Jeep牧馬人還是好車 指導(dǎo)價(jià)12.39萬(wàn)起/限時(shí)9.89萬(wàn)起 2026款哈弗大狗正式上市 智駕輔助誰(shuí)更強(qiáng) “白澤獎(jiǎng)”部分測(cè)試結(jié)果公布 三菱EVO冠軍車,來(lái)自POPRACE的選擇 消費(fèi)級(jí)芯片和車規(guī)級(jí)芯片的區(qū)別,終于有人說(shuō)清楚了 氫能源車的領(lǐng)頭者,豐田為什么難干成氫能源? Windsurf驚魂96小時(shí),AI閃電并購(gòu)戰(zhàn):谷歌天價(jià)挖人,Cognition逆襲接盤 零跑B01首批預(yù)訂用戶畫(huà)像公布:650激光雷達(dá)版最受歡迎,7月24日上市 ChatGPT有望原生支持編輯Excel和PPT文件,OpenAI挑戰(zhàn)微軟Office 比亞迪宋L GT申報(bào)圖 純電轎車/運(yùn)動(dòng)感強(qiáng) 阿里凈利潤(rùn)增長(zhǎng)曲線“旱地拔蔥”,拼多多則拐頭直下,二者差距是什么原因 Satechi推出兩用手機(jī)掛繩:60W充電+480Mbps傳輸,29.99美元