自人類抬首望向星空以來,對宇宙的好奇與探索便從未止步。當(dāng)前階段的宇宙學(xué),尤其是對宇宙大尺度結(jié)構(gòu)(Large-Scale Structure, LSS)的研究,已經(jīng)進(jìn)入了數(shù)據(jù)驅(qū)動和超算依賴的時代。科學(xué)家們試圖通過精密的計算機(jī)模擬,去追溯宇宙從誕生之初微小的量子擾動,如何演化成今天我們所見——一個由星系團(tuán)、超星系團(tuán)、宇宙纖維以及巨大空洞所構(gòu)成的巨型網(wǎng)絡(luò)。
然而,這類模擬所需的巨量信息資源,通常只有世界上少數(shù)幾臺頂尖的超級計算機(jī)才能勝任,且每次運(yùn)行往往需耗時數(shù)周乃至數(shù)月。但近日,由加拿大滑鐵盧大學(xué)領(lǐng)銜開發(fā)的一項(xiàng)軟件工具,正有望改寫這一游戲規(guī)則。
![]()
(github)
這款名為 Effort.jl 的軟件,采用了一種被稱為 AI 模擬器(Emulator)的技術(shù)模式,來取代傳統(tǒng)的、從頭開始的物理模擬。這款工具不是簡單地重復(fù)大尺度結(jié)構(gòu)有效場論(EFTofLSS)復(fù)雜的計算步驟,而是選擇訓(xùn)練一個優(yōu)化的神經(jīng)網(wǎng)絡(luò),來掌握和復(fù)制大模型的輸出模式。
我們可以將傳統(tǒng)的 EFTofLSS 模擬想象成一個極度精密的工廠,每次生產(chǎn)(模擬)都需要消耗大量的能源和時間。而 Effort.jl 就像一個高性能的代理系統(tǒng),它通過學(xué)習(xí)這家工廠的歷史生產(chǎn)記錄(即模型已有的計算結(jié)果),建立起一個高效的預(yù)測模型。這個網(wǎng)絡(luò)學(xué)習(xí)了從輸入?yún)?shù)(如暗物質(zhì)的密度、暗能量的特性等)到輸出預(yù)測(如星系在空間中的分布特征)之間的關(guān)系。
Effort.jl 的訓(xùn)練過程使用了 60,000 組不同宇宙學(xué)參數(shù)配置及其對應(yīng)的功率譜數(shù)據(jù), 通過五層隱藏層、每層 64 個神經(jīng)元的神經(jīng)網(wǎng)絡(luò)架構(gòu)來捕捉這些復(fù)雜關(guān)系。整個訓(xùn)練過程在一臺配備 8 核 CPU 的普通工作站上僅需約一小時。
正是基于這種技術(shù)方法上的創(chuàng)新,Effort.jl 可以在一臺普通的筆記本電腦上運(yùn)行,不再需要完全依賴超算的力量,極大降低了該方向的研究成本。
而在訓(xùn)練完成后, Effort.jl 的計算速度進(jìn)化也十分驚人:它對于星系功率譜的單次計算時間只需大約15 微秒——這個速度比傳統(tǒng)方法快了數(shù)個數(shù)量級。具體來說,傳統(tǒng)上需要超級計算集群“數(shù)天”才能完成的高收斂度分析任務(wù),Effort.jl 在一臺標(biāo)準(zhǔn)硬件上僅用略微超過 1 小時便可以完成。
不過,速度的提升必須以保證精度為前提。研究團(tuán)隊在《宇宙學(xué)和天體粒子物理學(xué)雜志》上發(fā)布了對于模型的測試結(jié)果——這些測試涵蓋了多個基準(zhǔn)數(shù)據(jù)集,包括對BOSS 巡天數(shù)據(jù)等真實(shí)觀測數(shù)據(jù)集的分析。結(jié)果顯示,Effort.jl 的預(yù)測結(jié)果與業(yè)界公認(rèn)、耗費(fèi)大量資源的 EFTofLSS 代碼pybird所得的貝葉斯后驗(yàn)概率分布(用于確定參數(shù)最佳值的統(tǒng)計分布)達(dá)到了高度的一致性。
該研究的第一作者 Marco Bonici 補(bǔ)充道:“在某些情況下,使用模型時你必須裁剪部分分析以加快速度,而使用 Effort.jl,我們能夠?qū)⒛切┤笔У牟糠忠舶ㄟM(jìn)來。”這意味著,在某些分析上,這款模仿器甚至能比傳統(tǒng)超算提供更精細(xì)的細(xì)節(jié)。
![]()
圖 | 相關(guān)論文(arXiv)
當(dāng)然,Effort.jl 也并非萬能。Bonici 特別強(qiáng)調(diào),這個工具無法替代科學(xué)家的專業(yè)判斷:"宇宙學(xué)家仍然需要負(fù)責(zé)設(shè)定合理的參數(shù)先驗(yàn)、解讀分析結(jié)果,并運(yùn)用物理直覺來確保結(jié)論的意義。Effort.jl 提供的是計算加速,而非科學(xué)洞察本身。"此外,模擬器的準(zhǔn)確性依賴于訓(xùn)練數(shù)據(jù)的質(zhì)量和覆蓋范圍——如果待分析的模型參數(shù)落在訓(xùn)練集邊界之外,預(yù)測精度可能會下降。不過團(tuán)隊已經(jīng)通過符號回歸 (symbolic regression)等技術(shù)來進(jìn)一步擴(kuò)展模擬器的適用范圍,從而在不損失精度的前提下進(jìn)一步提速。
這項(xiàng)工作的意義遠(yuǎn)不止于讓宇宙學(xué)計算變得更便宜、更快捷。它也代表了一種研究范式的轉(zhuǎn)變:從“我們能研究什么問題”轉(zhuǎn)向“我們想研究什么問題”。在過去,許多理論物理學(xué)家因?yàn)橛嬎愠杀具^高而不得不簡化模型假設(shè),或者在參數(shù)空間中只探索有限的區(qū)域。Effort.jl 這類工具的出現(xiàn),意味著研究者可以更自由地嘗試復(fù)雜模型,進(jìn)行更細(xì)致的敏感性分析,甚至在數(shù)據(jù)分析過程中實(shí)時調(diào)整策略。
目前,團(tuán)隊已經(jīng)將這款工具在 GitHub 平臺上進(jìn)行開源發(fā)布。無論是小型研究團(tuán)隊、還是單個的研究人員,都有機(jī)會利用一臺普通的電腦,參與到宇宙學(xué)數(shù)據(jù)分析中來。
而在未來幾年,對于即將到來的 DESI (Dark Energy Spectroscopic Instrument,暗能量光譜儀) 和 Euclid(歐幾里得空間望遠(yuǎn)鏡)等下一代大型巡天項(xiàng)目,這種能力尤為關(guān)鍵——這些項(xiàng)目將產(chǎn)生比以往多出數(shù)個數(shù)量級的數(shù)據(jù)量,傳統(tǒng)計算方法根本無力應(yīng)對。屆時 Effort.jl 或?qū)⒋箫@身手。
![]()
1.https://arxiv.org/html/2501.04639v1
2.https://www.sciencedaily.com/releases/2025/09/250918225001.htm#
運(yùn)營/排版:何晨龍





京公網(wǎng)安備 11011402013531號