亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當(dāng)前位置: 首頁 ? 資訊 ? 新科技 ? 正文

全球最強開源「定理證明器」出世!十位華人核心,8B暴擊671B DeepSeek

IP屬地 中國·北京 編輯:顧青青 新智元 時間:2025-07-17 20:17:23


新智元報道

編輯:桃子 好困

迄今為止最強大的開源定理證明器登場!Goedel-Prover-V2僅用8B參數(shù)擊敗671B的DeepSeek-Prover,并再次奪下數(shù)學(xué)PutnamBench冠軍。十位核心貢獻者,八大頂尖機構(gòu),讓AI形式化證明再破紀(jì)錄。

全球最強的開源「定理證明器」誕生了!

來自普林斯頓、清華、英偉達、斯坦福等八大頂尖機構(gòu)聯(lián)手,祭出了第二版Goedel-Prover-V2模型。


項目地址:https://blog.goedel-prover.com/

初代Goedel-Prover已被COLM 2025頂會錄用,曾在miniF2F Pass@32刷新SOTA,位列PutnamBench榜首。

這一次,新版模型一共有兩個參數(shù)版本:32B和8B。

歷經(jīng)數(shù)月迭代,Goedel-Prover-V2再次在PutnamBench上奪冠,用更少的算力,解決了64道數(shù)學(xué)難題。

而且,在IMO級別的基準(zhǔn)——MathOlympiadBench,新模型刷爆SOTA,一舉攻克了73個問題。

相比之下,DeepSeek-Prover-671B僅解決了50個問題。

另外,在匯集三大國際奧數(shù)競賽難題的MiniF2F基準(zhǔn)上,32B在Pass@32上拿下90.4%成績,擊敗了DeepSeek-Prover-V2-671B(82.4%),8B模型與之實力相當(dāng)。


它的出世,標(biāo)志著AI又在在自動形式化證明生成領(lǐng)域?qū)崿F(xiàn)了全新技術(shù)突破。

對此,有網(wǎng)友期待地表示,「當(dāng)前,IMO 2025正在激烈比拼中,不知接下來Goedel-Prover-V2的實戰(zhàn)表現(xiàn)如何」?


8B模型

一舉擊敗671B DeepSeek Prover

目前,研究團隊暫未放出arXiv論文。

不過,在項目主頁和Hugging Face,對最新Goedel-Prover-V2模型背后技術(shù)和性能基準(zhǔn),展開了詳實的介紹。



那么,小參數(shù)的模型是如何超越了671B?

這里,Goedel-Prover-V2以Qwen3?8B?和Qwen3?32B?作為基座模型,采用了標(biāo)準(zhǔn)的「專家迭代與強化學(xué)習(xí)」框架。

具體來說,研究團隊在一個完整流程中——形式化問題、生成并驗證證明,再利用新發(fā)現(xiàn)的正確證明訓(xùn)練下一代模型,并通過RL進一步提升性能。

接下來,他們還融入了三大創(chuàng)新技術(shù):

1. 分層式數(shù)據(jù)合成(Scaffolded data synthesis)

生成難度逐步遞增的合成證明任務(wù),對模型進行漸進式訓(xùn)練,使其能夠掌握愈發(fā)復(fù)雜的定理;

自動生成介于已解決簡單問題與未解復(fù)雜問題之間的中級難度題目,形成更平滑的難度遞進,為訓(xùn)練提供更密集、信息量更高的信號。

2. 驗證器引導(dǎo)的自我修正(Verifier-guided self-correction)

訓(xùn)練模型有效利用?Lean?編譯反饋,反復(fù)修訂自身證明,高度模擬人類完善證明的過程,并將這一任務(wù)融入監(jiān)督微調(diào)與強化學(xué)習(xí)階段。

3. 模型平均(Model averaging)

為防止后期訓(xùn)練導(dǎo)致多樣性喪失,將已訓(xùn)練的檢查點與基座模型進行平均。

這一簡潔技術(shù)能夠恢復(fù)多樣性,并在更大的?K?值下顯著提升?Pass@K?表現(xiàn)。

簡言之,融合多個模型檢查點,提升魯棒性與整體性能。


極少算力刷爆SOTA,Scaling超強

Goedel-Prover-V2首先會生成一個初始候選證明,再借助?Lean?編譯器的反饋進行迭代修正,以提高證明質(zhì)量。

研究中,模型進行了兩輪自我修正,但計算開銷依然可控——總輸出長度(包含初始證明及兩次修正)僅從標(biāo)準(zhǔn)的?32K? token適度增加到40K? token。

如下表所示,展示了Goedel-Prover-V2在Pass@32下的所有結(jié)果。

首先,在全部三個數(shù)據(jù)集中,旗艦32B?模型均顯著超越此前SOTA模型,即DeepSeek?Prover?V2?671B與Kimina?Prover?72B。

其次,在miniF2F數(shù)據(jù)集上,8B模型在性能上與DeepSeek?Prover?V2?671B相當(dāng),但模型規(guī)模僅為其?1/100。


如下成績是,Goedel-Prover-V2在PutnamBench基準(zhǔn)上,用更少的算力,擊敗所有SOTA位居榜首。


下面的Scaling曲線表明,在整個推理計算范圍內(nèi),Goedel-Prover-V2-32B始終優(yōu)于所有的頂尖模型。

也就意味著,新模型具備了出色的Scaling能力。


論文核心貢獻者之一Chi Jin稱,Goedel-Prover只用了高校實驗室里的GPU,就實現(xiàn)了超強性能。


十位核心作者,清北上交在列


Yong Lin


Yong Lin是普林斯頓大學(xué)語言與智能(PLI)的博士后研究員,導(dǎo)師是Chi Jin、Sanjeev Arora和Danqi Chen。

此前,他在香港科技大學(xué)獲得博士學(xué)位,師從張潼教授;在浙江大學(xué)獲得學(xué)士和碩士學(xué)位,專業(yè)排名1/207。

在攻讀博士學(xué)位之前,他于2017年至2021年在阿里擔(dān)任高級機器學(xué)習(xí)工程師。

他的研究聚焦于機器學(xué)習(xí)和LLM的后訓(xùn)練技術(shù)。主要研究方向包括:

形式化數(shù)學(xué)推理:讓大語言模型能夠使用可驗證的語言(即形式化語言,如 LEAN)進行推理。

LLM后訓(xùn)練:提升模型的有益性、無害性與誠實性等特質(zhì)。

Shange Tang


Shange Tang是普林斯頓大學(xué)運籌學(xué)與金融工程系的博士生,導(dǎo)師是Jianqing Fan教授與金馳教授。

此前,他在北京大學(xué)數(shù)學(xué)科學(xué)學(xué)院獲得學(xué)士學(xué)位。

他的研究興趣為統(tǒng)計學(xué)和機器學(xué)習(xí)的理論與應(yīng)用。

Bohan Lyu


Bohan Lyu目前在普林斯頓大學(xué)PLI,從事基于大語言模型與形式化語言的自動化數(shù)學(xué)定理證明研究,師從金馳教授。

此前,他在清華大學(xué)獲得學(xué)士學(xué)位。并曾在清華大學(xué)NLP實驗室(導(dǎo)師是劉知遠教授)和加州大學(xué)圣地亞哥分校Rose-STL-Lab(導(dǎo)師是虞琦教授)進行科研實習(xí)。

他的研究興趣為機器學(xué)習(xí)(ML)和自然語言處理(NLP)。

Ziran Yang(楊子然)


楊子然是普林斯頓大學(xué)電子與計算機工程系的博士生,師從金馳教授。

此前,他在北京大學(xué)元培學(xué)院獲得學(xué)士學(xué)位,到時是朱毅鑫教授、朱松純教授。

Jui-Hui Chung(鐘瑞輝)


鐘瑞輝是普林斯頓大學(xué)應(yīng)用與計算數(shù)學(xué)項目的博士生,師從Jacob Shapiro教授。

他本科及碩士畢業(yè)于臺灣大學(xué)物理系,師從Ying-Jer Kao教授,期間主要從事計算物理研究。

他的研究方向是拓撲絕緣體的數(shù)學(xué)物理特性。近期在Chi Jin教授指導(dǎo)下,開展基于LLM的自動定理證明研究。

Haoyu Zhao


Haoyu Zhao是普林斯頓大學(xué)的博士生,師從Sanjeev Arora教授。

此前,他在清華大學(xué)計算機科學(xué)實驗班(姚班)獲得學(xué)士學(xué)位,導(dǎo)師是陳衛(wèi)教授。

他的研究興趣橫跨數(shù)學(xué)、算法與學(xué)習(xí)的交叉領(lǐng)域。

Lai Jiang


上海交通大學(xué)。

Yihan Geng


北京大學(xué)。

Hongzhou Lin


Hongzhou Lin是亞馬遜應(yīng)用研究科學(xué)家,隸屬于AGI基礎(chǔ)團隊。

此前,他在法國INRIA格勒諾布爾中心獲得了博士學(xué)位,師從Zaid Harchaoui和Julien Mairal教授。期間,他首創(chuàng)了一階優(yōu)化算法的通用加速框架,為后續(xù)應(yīng)用科學(xué)研究奠定了重要理論基礎(chǔ)。

隨后在MIT的Stefanie Jegelka教授指導(dǎo)下完成機器學(xué)習(xí)方向的博士后研究。

目前,他主要從事LLM開發(fā)工作,專注于數(shù)學(xué)推理與問題解決能力的研究,涵蓋非形式化與形式化(如LEAN)兩大方向。

Chi Jin(金馳)


金馳是普林斯頓大學(xué)電氣與計算機工程學(xué)系助理教授,計算機科學(xué)系聯(lián)合聘任教員。

此前,他在加州大學(xué)伯克利分校獲得計算機科學(xué)博士學(xué)位,在北京大學(xué)獲得物理學(xué)學(xué)士學(xué)位。

他的研究方向包括,大模型推理與智能體、博弈論與多智能體學(xué)習(xí)、強化學(xué)習(xí)、統(tǒng)計學(xué)習(xí)理論、優(yōu)化方法。

參考資料:

https://blog.goedel-prover.com/


免責(zé)聲明:本網(wǎng)信息來自于互聯(lián)網(wǎng),目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點。其內(nèi)容真實性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系我們,本站將會在24小時內(nèi)處理完畢。

国产淫片av片久久久久久| 亚洲欧美另类小说| 亚洲欧美国产精品va在线观看| 小说区视频区图片区| 91亚洲国产成人精品一区二三 | 91精品又粗又猛又爽| 亚洲精品视频在线| 天堂中文视频在线| 欧美色图在线观看| 免费在线观看你懂的| 亚洲电影av在线| 久热精品在线观看| 97视频免费观看| 亚洲免费成人网| 97久久天天综合色天天综合色hd| 日本成人中文字幕| 欧美成人激情视频| 天堂网avav| 中文字幕日本精品| 亚洲av无码一区二区三区dv| 久久久久一区二区| 91美女精品福利| 亚洲欧美日韩国产yyy| 久久久综合精品| 免费一级a毛片夜夜看| 色播亚洲视频在线观看| 2024国产精品视频| 亚洲视频在线a| 精品福利二区三区| 国产精品传媒在线观看| 极品日韩久久| 亚洲午夜精品17c| 国产草草浮力影院| 欧美另类交人妖| 成人福利视频在线| 911国产在线| 亚洲伦理中文字幕| 欧美波霸videosex极品| 精品少妇一区二区三区免费观看| 午夜精品久久久久久久99| 国产精品第二页| 国内外成人在线| 狠狠干狠狠操视频| 欧美成人国产va精品日本一级| 麻豆91精品91久久久的内涵| 日本一二三不卡视频| 国a精品视频大全| 国产精品18久久久久久久网站| 800av在线免费观看| 日韩三级视频在线观看| 国产一区二区波多野结衣| 久久国产精品免费一区| 欧美视频二区36p| 国产无套粉嫩白浆内谢| 欧美一级二级三级| 欧美酷刑日本凌虐凌虐| 国产影视一区二区| 99爱视频在线| 91精品国产综合久久精品 | 免费av网站大全久久| 国产肉体ⅹxxx137大胆| 亚洲国产一区自拍| 久久99精品久久久久久动态图| 在线黄色免费观看| 欧美精品少妇videofree| 91网上在线视频| 九九热视频在线免费观看| 亚洲综合在线小说| 一道本成人在线| 一级α片免费看刺激高潮视频| 男人的天堂成人| 亚洲欧美制服综合另类| 久久国产成人午夜av影院| 成人性生交免费看| 538国产精品一区二区在线| 国产日产欧美一区| 1级黄色大片儿| 中文字幕第一页亚洲| 国产亚洲人成网站| 日本妇女毛茸茸| 波多野结衣三级在线| 伊人成人开心激情综合网| 国产欧美日韩在线| 中文字幕免费在线观看视频| 国产又黄又爽免费视频| 538国产精品视频一区二区| 久久久久久久精| 国产一区二区精彩视频| 一区二区三区久久网| 欧美精品少妇videofree| 欧美日韩亚洲成人| 久久66热偷产精品| 黄瓜视频在线免费观看| 免费高清视频在线观看| 超碰97在线播放| 国产中文日韩欧美| 91国产视频在线观看| 午夜精品久久久久久久91蜜桃| 国产又粗又长又爽又黄的视频| 国产在线视频91| 欧美成人三级在线| 中文字幕在线不卡一区二区三区| 成人av无码一区二区三区| 日韩在线一区视频| 国产免费一区二区三区| 日韩在线观看免费全| 精品国产鲁一鲁一区二区张丽| 日韩黄色在线观看| 免费一级a毛片夜夜看| 男人的天堂日韩| 亚洲一区二区三区视频播放| 国产亚洲精品日韩| 欧美日韩一区二区在线播放| 丁香六月综合激情| 一本色道久久综合熟妇| 亚洲人成人无码网www国产 | 少妇一区二区三区四区| 一级性生活免费视频| 老熟妇仑乱视频一区二区| 日韩欧美精品在线不卡 | 综合久久国产九一剧情麻豆| 99久久久无码国产精品免费| 婷婷社区五月天| 国产5g成人5g天天爽| www.国产二区| 97碰碰视频| 欧美高清性猛交| 亚洲欧洲高清在线| 欧美中文字幕亚洲一区二区va在线 | 久久99精品网久久| 亚洲码在线观看| 欧美伦理片在线看| 污视频软件在线观看| 日韩美女视频一区| 91丨九色丨尤物| 在线免费观看视频网站| 久久久久在线视频| 九九精品视频免费| 精品无码国产一区二区三区51安| 精品国产一区三区| 欧美午夜免费| 99在线视频免费观看| 清纯唯美日韩制服另类| 欧美激情中文字幕乱码免费| 亚洲精品一二区| 日韩精品专区在线影院观看| 欧美色xxxx| 亚洲成av人影院| 亚洲一区在线视频| 亚洲欧洲精品一区二区三区不卡| 国产另类ts人妖一区二区| 日韩在线一区二区三区四区| 亚洲无码精品在线观看| 男人天堂2024| 99re这里只有精品在线| 国产一级淫片a视频免费观看| 一本大道综合伊人精品热热| 亚洲国产精品毛片| 亚洲综合视频在线播放| 日韩美女视频在线| 久色视频在线播放| 亚洲天堂网在线观看视频| 99久久国产免费看| 欧美性猛交xxxx偷拍洗澡| 欧美日韩xxx| 免费特级黄色片| 夜夜躁狠狠躁日日躁av| 天天爱天天做天天爽| 精品一区二区三区香蕉蜜桃| 香蕉乱码成人久久天堂爱免费| 国产精品视频入口| 欧美88888| 人人草在线观看| 亚洲六月丁香色婷婷综合久久| 亚洲精品水蜜桃| 91精品国产91热久久久做人人 | 久久国产主播精品| 国产农村妇女精品一区| 日本熟女一区二区| 欧美肥胖老妇做爰| 激情婷婷综合网| 亚洲特黄一级片| 日韩精品第一页| 久久在线91| 韩国三级日本三级少妇99| 日韩人妻精品无码一区二区三区| 久久一区二区三区视频| 午夜精品免费在线观看| 色综合久综合久久综合久鬼88| 日韩中文字幕av在线| 精品人妻一区二区三区视频| 国产视频在线观看免费| 亚洲精品免费在线播放| 一区二区三区在线观看国产| 91国内精品久久| 久激情内射婷内射蜜桃| 国产日韩av一区| 久久久久久久久一区| 国产精品91av| 极品少妇一区二区| 日韩在线资源网| 欧美一级视频在线观看| 精品无人乱码一区二区三区的优势| 色姑娘综合av| 亚洲网中文字幕| 日韩免费av片| 国产一区二区三区香蕉| 亚洲高清久久久| 社区色欧美激情 | 国产日韩欧美自拍| 亚洲成人自拍视频| 亚洲一区二区三区四区精品| 日本熟妇毛耸耸xxxxxx| 久久中文精品| 一区二区三区高清在线| 精品视频久久久久久| 国产欧美最新羞羞视频在线观看| 国产高清精品软男同| 亚洲一二三四五| 国产午夜小视频| 免费观看日韩av| 亚洲成人精品一区二区| 国产一区二区三区视频在线观看| 91精品视频免费看| 精品人妻少妇一区二区| 懂色av蜜桃av| 久久伊人亚洲| 在线一区二区三区做爰视频网站| 久久中文字幕在线视频| 欧美精品一区在线发布| asian性开放少妇pics| 亚洲一区二区美女| 国产91在线亚洲| 激情国产一区二区| 国产视频精品xxxx| 久久免费视频2| 夜夜躁狠狠躁日日躁av| 亚洲第一精品夜夜躁人人躁| 图片区小说区区亚洲五月| 免费观看a级片| 国产精品系列在线| 黄色激情在线视频| 亚洲婷婷在线视频| 成人资源av| www.久久精品视频| 欧美国产日韩中文字幕在线| a一级免费视频| 国产女人18毛片水18精| 色噜噜狠狠狠综合曰曰曰| 国产黄色三级网站| 精品国产3级a| 性一交一乱一色一视频麻豆| 一区中文字幕在线观看| 精品久久久久久国产91| 性活交片大全免费看| 欧美mv日韩mv国产网站app| 黄色国产在线播放| 91精品国产一区二区| 小明看看成人免费视频| 日韩国产精品91| 精品国产不卡一区二区三区| 捆绑裸体绳奴bdsm亚洲| 8v天堂国产在线一区二区| 国产婷婷在线观看| 久久免费看少妇高潮| yellow中文字幕久久| 在线观看国产精品一区| 九九热最新视频//这里只有精品 | 日本韩国精品在线| 国产精品探花在线播放| 精品福利在线看| 国产人妻人伦精品1国产丝袜| 黄色小视频免费观看| 国产精品入口夜色视频大尺度| 人妻一区二区三区免费| 99久久99久久精品国产片| 一区二区三区美女视频| 动漫精品一区一码二码三码四码| 国产免费一区| 亚洲成人免费观看| 久久婷婷一区二区| 亚洲欧洲一区二区福利| 国产日韩欧美高清| 中文字幕乱码人妻综合二区三区 | 国产一区二区在线播放视频| 91久久精品网| 中文字幕99| 成人性生交大合| 亚洲国产成人va在线观看麻豆| 狠狠综合久久av一区二区小说| 欧美一级特黄a| 天天av天天翘| 欧美精品在线免费观看| 永久免费av无码网站性色av| 自拍av一区二区三区| 91视频免费网站| 成人免费毛片男人用品| 亚洲黄在线观看| 成人欧美精品一区二区| 国产精品丝袜久久久久久app| 国产欧美一区二区三区在线| 亚洲成人生活片| 欧美日韩一区不卡| 中文字幕第80页| 国产精品天美传媒沈樵| 欧美日韩精品一区| 久久电影国产免费久久电影| 2020久久国产精品| 久草成人在线视频| 精品日韩在线观看| 天天躁日日躁狠狠躁av麻豆男男| 国产精品毛片a∨一区二区三区| 国产一区二区无遮挡| 黄色av小说在线观看| 国产91成人video| aaa欧美色吧激情视频| 国产裸体视频网站| 亚洲欧美日韩爽爽影院| 91香蕉一区二区三区在线观看| 夜夜躁日日躁狠狠久久88av| 无码人妻久久一区二区三区不卡| 国产福利精品av综合导导航| 久久亚洲风情| 熟女视频一区二区三区| 欧美一区二区三区性视频| 这里只有久久精品视频| 欧美凹凸一区二区三区视频 | 亚洲高清视频在线观看| 天天操天天综合网| 中文字幕+乱码+中文| 亚洲国产婷婷香蕉久久久久久| 蜜桃91麻豆精品一二三区 | 亚洲a视频在线| 亚洲最大福利网| 国产蜜臀97一区二区三区| www.色天使| 午夜精品久久久99热福利| www.com欧美| 欧美xxxx黑人又粗又长密月 | 性久久久久久久| 无码精品一区二区三区在线播放| 日韩欧美成人免费视频| 波多野结衣av无码| 色香蕉在线观看| 精品不卡在线视频| 国产深喉视频一区二区| 日韩肉感妇bbwbbwbbw| 久热精品视频在线观看一区| 亚洲一区二区三区中文字幕| 久久久青草婷婷精品综合日韩| 9.1片黄在线观看| 妺妺窝人体色www在线小说| 久久婷婷人人澡人人喊人人爽| 亚洲人成人99网站| 一区二区三区不卡在线观看 | 久久99精品久久久| 亚洲黄色片免费看| 456亚洲影院| 亚洲无人区一区| 伊人网av在线| 日本高清不卡三区| 亚洲国产成人在线| 国产人妻精品一区二区三区不卡| 国产精品视频成人| 懂色av一区二区夜夜嗨| 国产精品探花一区二区在线观看| 91九色国产视频| 精品夜色国产国偷在线| xf在线a精品一区二区视频网站| 波多野结衣电影免费观看| 欧美高清在线观看| 一区二区三区久久| 日本视频中文字幕一区二区三区 | 欧美日韩五月天| 男女男精品视频| 韩国三级与黑人| 91在线观看免费| 欧美日韩国产一二三| 国产亲伦免费视频播放| 任你操这里只有精品| 欧美激情一区二区久久久| 中文字幕av一区二区三区免费看 | 日韩美一区二区三区| 日韩精品电影在线观看| www.88av| 视频一区二区在线| 国内揄拍国内精品少妇国语| 日韩欧美高清视频| 亚洲国产精品18久久久久久| 国产成人精品视频免费| 国产毛片久久久久久国产毛片| 国产精品色视频| 国产精品免费视频xxxx| 欧美福利小视频| 高清亚洲成在人网站天堂| 日韩精品中文字幕在线| 日韩精品一区二区三区四区| 亚洲成人久久影院| 中文字幕精品在线不卡| 久久成人羞羞网站| 一级久久久久久| 美女100%露胸无遮挡| 一区二区三区四区视频在线观看 | 日本丶国产丶欧美色综合| 激情综合五月婷婷| 真实国产乱子伦对白在线| 免费黄色一级网站| 国产主播一区二区三区四区| 精品亚洲国产成av人片传媒| 亚洲色欲色欲www在线观看|