![]()
新智元報(bào)道
編輯:KingHZ
ICLR 2026評(píng)審結(jié)果震撼出爐:投稿量暴增至近2萬(wàn)篇,卻迎來(lái)分?jǐn)?shù)大滑坡,平均分從5.12跌至4.2。審稿人吐槽論文質(zhì)量低下,甚至疑似AI生成,這場(chǎng)學(xué)術(shù)盛宴為何變味?
ICLR 2026評(píng)審結(jié)果公布了!
這屆ICLR論文投稿數(shù)量創(chuàng)歷史新高。
根據(jù)Paper Copilot網(wǎng)站統(tǒng)計(jì),與2025年的11672篇總投稿論文相比,ICLR 2026共有19631篇投稿,數(shù)量增加了,但質(zhì)量卻下降了——
ICLR 2025最高分為滿分10分,ICLR 2026最高為8.5;
ICLR 2025平均分為5.12分,ICLR 2026平均為4.20。
![]()
鏈接:https://papercopilot.com/statistics/iclr-statistics/iclr-2026-statistics/
已有多名投稿人經(jīng)歷人生中第一次在ICLR上獲得0分:
![]()
![]()
![]()
左右滑動(dòng)查看
國(guó)內(nèi)有投稿人甚至3篇投稿「全軍覆沒」,發(fā)推感嘆獨(dú)特的人生經(jīng)歷:
![]()
![]()
![]()
![]()
左右滑動(dòng)查看
ICLR 2026將于明年4月23日至27日,在巴西里約熱內(nèi)盧舉行。
與NeurIPS和ICML一樣,ICLR是機(jī)器學(xué)習(xí)和人工智能研究領(lǐng)域中三大高影響力的會(huì)議之一。
![]()
ICLR,全稱「International Conference on Learning Representations 」(國(guó)際表征學(xué)習(xí)大會(huì)),在2012年由圖靈獎(jiǎng)得主Yann LeCun和Yoshua Bengio創(chuàng)立。
ICLR 2026平均得分低了近1分
總體上,ICLR的分?jǐn)?shù)平均值比去年下降了近一個(gè)點(diǎn):
2026年:前30%的提交分?jǐn)?shù)超過約5.0分
2025年:前30%的提交分?jǐn)?shù)超過6.0分
![]()
![]()
生物醫(yī)學(xué)工程博士Afshin Khadangi使用API獲取了19129條評(píng)審意見,總結(jié)了其中的一些亮點(diǎn):
僅有1792篇(約9%)論文的平均評(píng)分達(dá)到6分及以上。
1篇論文(id 12681)獲得了9條評(píng)論!
在個(gè)人評(píng)分中,平均值為4.22,標(biāo)準(zhǔn)差為1.86,來(lái)自74,371條評(píng)論。
![]()
![]()
![]()
![]()
![]()
審稿人Cheems Wang注意到所在領(lǐng)域沒變論文至少有一個(gè)極端分?jǐn)?shù),今年的評(píng)分確實(shí)保守了。
![]()
審稿人Yu Su也注意到平均分有些低,225篇論文中只有18篇論文平均初始得分超過了6分,勉強(qiáng)達(dá)到會(huì)議接受底線。
![]()
清華大學(xué)博士、普林斯頓博士后發(fā)現(xiàn)了ICLR 2026明顯的評(píng)分模式:
提交ID越高,評(píng)分似乎越低。
![]()
有人兩年前就發(fā)現(xiàn)類似模式了:
![]()
讓人大吃一驚的是,評(píng)審現(xiàn)場(chǎng)驚現(xiàn)「精神病」評(píng)論:
![]()
如此激烈的審稿現(xiàn)場(chǎng),引起Reddit網(wǎng)友圍觀:
![]()
現(xiàn)在原始的審稿意見已刪除,審稿人為自己的冒犯性言論道歉,但堅(jiān)持稱提出的論文問題沒有任何錯(cuò)誤。
![]()
另一位來(lái)自亞馬遜的一位ICLR審稿人也有牢騷:
在審稿意見剛公布后,我所負(fù)責(zé)的一篇論文就被撤稿了。
而且今年在多個(gè)頂級(jí)會(huì)議上,他已經(jīng)遇到好幾次類似情況。
![]()
他表示,這類論文往往寫得很差,充斥著未經(jīng)定義的新術(shù)語(yǔ)、缺失引用,甚至有些段落看起來(lái)像是AI生成的。
審稿人常常要花五六個(gè)小時(shí)去搞懂作者的方法和實(shí)驗(yàn)(而這些實(shí)驗(yàn)通常也不怎么樣),結(jié)果最后論文一撤了之,換個(gè)會(huì)議重新投。
如果作者不做改進(jìn),新的審稿人也還得再受一遍罪。
他提議:「是否該設(shè)立某種機(jī)制,對(duì)那些頻繁撤稿或無(wú)故跳過rebuttal階段的作者,給予臨時(shí)投稿禁令?」
不過,他之后另發(fā)推文表示,某些論文和評(píng)審的質(zhì)量之低,讓人沮喪。
他認(rèn)為,這種沮喪很大程度上源于大家對(duì)論文和評(píng)審質(zhì)量分布的期望:
論文質(zhì)量并不遵循正態(tài)分布,而我們卻常常試圖給出遵循正態(tài)分布的評(píng)分。下限遠(yuǎn)比上限離平均值更遠(yuǎn)。評(píng)審質(zhì)量也是如此。
但我們期望正態(tài)分布,也就意味著我們期望低質(zhì)量的論文或評(píng)審很少,但這并非現(xiàn)實(shí)。
這種對(duì)正態(tài)分布的錯(cuò)誤假設(shè)在生活中許多領(lǐng)域都存在,正如塔勒布的《黑天鵝》中揭示的。
![]()
meta的研究人員Tarun Kalluri則表示,作為審稿人,列表上一半的論文他花的時(shí)間比作者還多。
![]()
也有審稿人表示,一旦發(fā)現(xiàn)「屢投屢拒」的低分論文,他會(huì)馬上確認(rèn)觀點(diǎn),提交簡(jiǎn)短的評(píng)論,避免浪費(fèi)時(shí)間。
![]()
不少投稿人對(duì)AI頂會(huì)的同行評(píng)議,意見也很大。
而類似一幕在ICLR 2026也上演了——
圖賓根大學(xué)博士生Alexander Panfilov直接說(shuō)續(xù)集已面世。
![]()
原因竟是論文中提到「白箱 VS 黑箱」,被認(rèn)為這些詞匯「帶有種族歧視的隱含意義」,要求小改。
![]()
DeepMind研究員
評(píng)審是「隨機(jī)數(shù)生成器」
DeepMind研究員Neel Nanda祝賀了所有投稿人,并提供了一份論文反駁(rebuttal)指南。
![]()
![]()
鏈接:https://www.lesswrong.com/posts/vJNQZqgnKSxTBdFbS/neel-nanda-s-shortform?commentId=qqHPrBheFwQgrJbzN
他給出的建議就是要大家記住一件事——
同行評(píng)審已經(jīng)被正式驗(yàn)證是一種「隨機(jī)數(shù)生成器」。
在一項(xiàng)隨機(jī)對(duì)照實(shí)驗(yàn)中,哪怕是被評(píng)為「重點(diǎn)報(bào)告」的論文,換一個(gè)審稿組也有一半被拒。
所以,別把自我價(jià)值寄托在這輪學(xué)術(shù)輪盤賭是落在紅格還是黑格上。
![]()
如果評(píng)審的批評(píng)聽起來(lái)不太靠譜——那很可能確實(shí)如此(也不排除是某個(gè)大語(yǔ)言模型寫出來(lái)的)。
但如果評(píng)審意見有道理(當(dāng)然你得克服自己的防御心態(tài)來(lái)看),那就太好了——你得到了能讓論文變得更好的寶貴反饋!
這份反駁指南本來(lái)是為了頂會(huì)NeurIPS而寫,但就ICLR來(lái)說(shuō),Neel Nanda認(rèn)為以上情況依然普遍存在。
但不同之處在于,ICLR更鼓勵(lì)作者在rebuttal階段補(bǔ)充重要實(shí)驗(yàn),并上傳修訂稿。我確實(shí)看到ICLR的打分變化幅度通常比其他會(huì)議大,但這也意味著需要付出更多額外工作。
另外請(qǐng)注意,ICLR的所有論文和評(píng)審意見都是永久公開的,還會(huì)被Google檢索收錄——
所以即便你覺得這篇論文沒希望了,也還有動(dòng)機(jī)寫清楚為什么評(píng)審意見不合理。
他推薦的rebuttal流程如下:
1.把所有評(píng)審意見復(fù)制到一個(gè)Google文檔里;
2. 給每一條意見做批注,把它們歸類為:
3. 誤解、觀點(diǎn)不一致、表述問題、技術(shù)問題;
4. 和合作者一起討論如何逐條回應(yīng)——優(yōu)先處理重要的;
5. 然后,寫出要點(diǎn)提綱,盡早請(qǐng)人反饋;
6. 最后潤(rùn)色整理好,提交。
通常你需要針對(duì)每位評(píng)審寫一段回應(yīng),并總結(jié)多位評(píng)審提出的問題。
牢記「反駁」階段的三個(gè)核心目標(biāo):
改進(jìn)論文。其實(shí),評(píng)審經(jīng)常提出一些有用的建議,既然是做科研,最終還是為了把研究做好、把成果清楚傳達(dá)出去。
說(shuō)服評(píng)審打高分。爭(zhēng)取讓他們對(duì)你產(chǎn)生好感,自然更愿意調(diào)高分?jǐn)?shù)。
對(duì)付不講理的評(píng)審。如果某位評(píng)審明顯針對(duì)你,那核心對(duì)象就變成了領(lǐng)域主席和其他評(píng)審——你要用有理有據(jù)的回應(yīng),讓他們意識(shí)到這位評(píng)審的意見站不住腳。換句話說(shuō):哪怕是針對(duì)性很強(qiáng)的批評(píng),也要認(rèn)真回應(yīng),只是說(shuō)服的對(duì)象換了。
最重要的一點(diǎn):讓人相信你真的改進(jìn)了論文。
而且,時(shí)間是有限的,你希望最大化單位時(shí)間內(nèi)的回報(bào),而新的實(shí)驗(yàn)通常比撰寫或概念反駁要花費(fèi)更長(zhǎng)的時(shí)間——謹(jǐn)慎地進(jìn)行優(yōu)先級(jí)排序。
參考資料:
https://x.com/ShuaichenChang/status/1988626893273468976
https://x.com/ShuaichenChang/status/1988719279580274768





京公網(wǎng)安備 11011402013531號(hào)