![]()
新智元報道
編輯:LRST
arXiv最新政策禁止直接接收未經同行評審的綜述和立場論文,以應對AI生成論文的泛濫,但堵不如疏。多倫多大學、清華、北大等18所國內外頂尖高校聯合發布新平臺aiXiv,支持AI和人類共同撰寫、評審和迭代科研成果,采用多階段AI同行評審機制,提升效率和質量。這一變革引發了對傳統學術出版體系的深刻反思,也帶來了對未來科研模式的期待與擔憂。
近日,arXiv正式發布了計算機科學(CS)分類下的最新投稿政策:綜述(Review)與立場論文(Position Paper)將不再直接接收,除非論文已被正式期刊或會議接收并完成同行評審。
換言之,即便是學術會議的workshop論文,也不再被視為合格來源。
這一新規的出臺,標志著arXiv在面對AI生成論文爆發式增長時首次設下「準入門檻」。
過去半年中,arXiv CS每月收到數百篇AI生成或半自動生成的綜述與立場論文,質量參差不齊,令依賴志愿者人工審核的系統幾近崩潰。
為減輕負擔、維護內容公信力,arXiv被迫啟動這場「史上最嚴整頓」。
類似現象也出現在頂會評審體系中,例如ICLR2025近期公開數據顯示,約五分之一評審意見被判定為幾乎完全由大模型生成,評審負載的增長正在沖擊傳統學術治理結構。
在這種背景下,arXiv的政策調整引發了廣泛擔憂:當綜述與立場文章失去即時公開渠道,AI科學研究的前沿討論空間將被嚴重壓縮。
AI時代下,學術傳播的速度已成為科研創新的重要組成部分:一篇綜述若要等上三到六個月通過傳統評審流程,其價值往往早已被更新一代模型或算法所替代。
![]()
論文鏈接:https://arxiv.org/abs/2508.15126
在線體驗:https://aixiv.science/
新時代的回應
aiXiv登場
面對這一斷層,aiXiv作為新一代科研基礎設施早早給出了解決方案。
aiXiv是全球首個同時接收AI-authored與Human-authored內容、支持Survey、Position、Proposal、Paper等多類型研究成果,并配備AI Review與返修迭代機制的開放預印本與科研智能體社區環境。
與arXiv不同,aiXiv不僅僅是一個論文托管平臺,而是一個為未來的AI科學家(AI Scientist)、機器人科學家(Robot Scientist) 、AI-Co Scientists以及人類科學家量身打造的科研生態系統。
它支持從提交、評審、返修、發布到版本化追蹤的完整科研生命周期,并以結構化AI同行評審取代傳統的單一人工評審模式,真正實現 「由 AI 生成、由 AI 審核、由人類共治」 的新型科研發布體系。
![]()
aiXiv測試網站demo展示
傳統學術出版體系的挑戰
aiXiv 團隊在論文中指出,傳統的學術出版體系正面臨一場前所未有的結構性挑戰。
這一體系最初是為「人類作者 + 人工評審」的科研模式設計的,但在AI生成研究成果呈爆炸式增長的今天,它已經顯得力不從心。
首先,人工評審的效率成為最大瓶頸。
無論是會議還是期刊,現有的評審流程都高度依賴專家人工審核,周期長、吞吐低,根本無法跟上AI每天成百上千篇自動生成論文的速度。
其次,預印本平臺的質量把控幾乎為零。
像arXiv這樣的平臺雖然讓論文可以即發即見,但缺乏有效的質量驗證機制,導致信息「可發布但不可信」,難以支撐科研信用體系的建立。
署名問題也愈發棘手。
AI在科研中的參與度越來越高,但如何界定作者身份、貢獻比例與署名規則,目前還沒有共識。這種模糊不僅影響學術倫理,也讓成果傳播與引用都陷入灰色地帶。
與此同時,科研早期階段的提案(Proposal)幾乎沒有容身之處。
現有平臺主要面向論文發布,而缺乏一個開放、結構化的空間,用于想法的交流、碰撞與迭代。這意味著大量創新在萌芽期就被埋沒,沒有機會獲得同行反饋或共創放大。
再者,AI評審自身也存在安全與對齊難題。
基于大模型的自動審稿系統容易遭遇提示詞注入(prompt Injection)或語義操縱,評審意見的證據支撐和基線一致性也難以保證。如果缺乏有效治理,這些隱患可能反噬整個評審體系的公信力。
最后,科研智能體之間仍然各自為政。
無論是人類研究者、AI審稿人還是實驗執行機器人,目前都沒有一個統一、開放、可擴展的科研環境讓它們協同工作。缺乏標準化接口,也讓研究成果的質量追蹤與版本溯源幾乎無從談起。
![]()
各類型學術平臺功能對比:自動評審(AR)、AI作為作者(AA)、提示詞注入檢測(PID)、以科研智能體接口(AI)
在討論「通用人工智能(AGI)」或「通用機器人」的定義時,人們往往首先想到一些具象化的測試標準。
例如,AI是否能在高考中取得優異成績、是否能在國際數學奧林匹克(IMO)上摘得金牌,或機器人能否像人類一樣完成家務、照顧老人。
這些標準的確能夠體現智能系統的理解力和適應性,但它們仍然局限于模仿與替代人類任務。 真正值得關注的,是更深層的衡量維度:AI是否能夠在科學研究中創造出全新的知識與發現。
在aiXiv團隊看來,推動科學邊界、突破人類認知與物理極限的能力,才是判斷超級智能(Superintelligence)是否真正誕生的重要標志之一[1]。
科學創新本身就是人類智慧的最高體現,而當AI也能在這一層面實現自主突破時,「智能」的定義將被重新塑造。
長期以來,科研的進展受到研究者創造力、學術背景和時間等因素的限制。 但隨著大語言模型(LLM)和智能體(AI Agent)技術的快速發展,這種局限正被逐步打破。
如今的AI不僅能輔助科學家工作,更能夠從提出研究問題、規劃實驗設計到撰寫論文,全流程自動完成。
來自Sakana AI的Chris Lu團隊提出的The AI Scientist [2], 以及斯坦福大學James Zou團隊的The Virtual Lab [3],已經在實踐中驗證了 AI 作為「自主科學家」的可行性。 這些研究共同揭示出一個趨勢:科學發現正邁入新的規模時代Scaling Laws[1]。
當這種「科學智能」真正進入規模化階段,人類社會是否已準備好迎接它的到來?
馬斯克在2024年曾預測,未來三年內可能會出現200到300億數量級的類人機器人。
即便將這一數字縮減,去掉物理形態,僅計算虛擬的AI Agents,其增長速度仍然呈指數趨勢。
想象一下,一億個科研型AI智能體同時生成研究提案與論文,所帶來的評審需求已經遠遠超出人類評審體系的承載能力。 事實上,這一問題的征兆已經顯現。
在2025年,NeurIPS與AAAI的投稿量都突破三萬篇,「審稿人不夠用」正逐漸成為整個學術界的現實困境。
在這一背景下,一個關鍵問題浮出水面: 當AI科學家與機器人科學家持續產生海量科研成果時, 我們應如何建立一個既能承載、又能評審并信任這些成果的全新科研體系?
aiXiv的系統化解決方案
aiXiv的誕生,正是在這種科研體系轉型背景下提出的全新嘗試,它是全球首個面向AI Scientists與Robot Scientists,以及人類科學家所產出的研究提案(Research Proposal)與論文(Paper), 并在開放獲取(Open Access)的基礎上,引入了AI同行評審與多輪返修機制的平臺。
aiXiv的目標是為人類研究者與各類科研智能體共同搭建一個協作生態, 打破現有學術體系的割裂與封閉,讓科研不再只是「發表一次」,而是形成可持續演化的循環過程。
從提交、評審、返修到發布,整個流程都可以在平臺內完整閉環,研究者與智能體也能通過標準化接口(API、MCP)無縫接入,在同一環境中進行結構化協作與知識積累。
![]()
aiXiv平臺總覽
在機制設計上,aiXiv 借鑒了傳統學術出版的優點,又進行了系統性的重構。
平臺采用多階段、結構化的評審流程,使研究提案與論文能夠在不斷的反饋與迭代中持續優化。
同時,平臺對每個版本的修改和改進過程都進行版本化記錄,形成可追蹤的「質量演化軌跡」。
通過多模型投票機制,aiXiv 避免了單一模型或單一審稿人的偏見, 讓最終結論在多方共識下更加公平、穩定與可靠。
在安全性與對齊層面,aiXiv同樣引入了多項創新措施。 平臺在評審環節中集成了檢索增強技術,使AI生成的評審意見能夠與真實文獻相互驗證, 確保每一條結論都建立在事實與證據基礎之上。
此外,系統還配備多層提示詞注入檢測與防御模塊,用于識別潛在的操縱與攻擊行為, 從而保證整個評審過程的公正性與可信度。
根據團隊的實驗結果,在論文配對評審(Pairwise Review)任務中,大語言模型的準確率可達81%, 這說明AI審稿系統不僅能理解學術內容,還具備相當程度的判斷力。
換句話說,LLM不再只是科研內容的生成者,而是能與人類共同參與評估與改進的「科研合作者」。
通過這種人機協作的循環機制,aiXiv期望讓科學研究在質量與效率上同時實現持續提升。
![]()
不同模型在ICLR 2024與ICLR 2025測試數據集上的論文Pairwise準確率對比。w/o:不使用 RAG;w/:使用 RAG
![]()
配對準確率與評審改進效果的評估。改進評審流程帶來了顯著提升:所有論文(100%)和大部分提案(80%)在返修后質量得到改進。平均接收率大幅上升,提案從 0% 提高至 45.2%,論文從 10% 提高至 70%。
aiXiv的新型范式帶來的討論與擔憂
aiXiv論文與平臺發布后,迅速引起了學術界的廣泛關注。
反饋聲音呈現出鮮明的兩極:一方面是對未來科研模式的期待與贊許,另一方面是對體系穩定性的審慎與思考。
一些評論者給予了極高評價。
有人感嘆,「學術界曾經依靠填補那些被深入研究領域遺留下的細小空白而繁榮,但這些空白已經越來越少。現在,唯有真正的突破才有意義。」
也有人指出,「人工智能正在撼動學術體系的根基。但這些改變究竟代表了真正的創新,還是只是在修補人類的思考?學界必須作出選擇,是主動擁抱變化,還是被時間拋在身后。」
aiXiv團隊認為,隨著AI與機器人科學家的發展,那些增量式的創新點和「小修小補」的工作會被AI快速完成與驗證,而這反而會促使研究者把精力集中在更具挑戰、更具原創性的科學難題上,從而推動真正的突破性研究。
當然,也有不少謹慎甚至擔憂的聲音。
有學者提醒:「科學不僅僅是發表論文,它更依賴共識、復現與信任。如果缺乏良好的治理機制,AI 生成內容的激增可能會掩蓋真正的科學發現。」
還有人擔心:「即便在 arXiv 上,論文的真實性有時也會受到質疑。而在一個由 AI 生成內容主導的系統中,這種不確定性似乎會更為突出。」
這些擔憂并非意外,事實上,它們正是aiXiv設計機制時重點考慮的出發點。
平臺為AI與人類評審者提供了統一的評審接口,讓多種類型的審稿智能體與人類專家能夠共同參與評審,形成多維度的判斷體系。
這種人機共審的模式,既是對科研質量的保障,也是對學術信任的回應。
aiXiv團隊認為,隨著AI的學術判斷與評審能力不斷進化,科研評審體系或將迎來新的范式。
在未來的某個階段,AI評審不僅能接近人類評審的專業水準,甚至有可能在一致性與客觀性方面超越傳統模式,這種演化,或許將成為科研出版史上的一次深層變革。
科研范式的雙重顛覆
aiXiv團隊認為,這一體系的建立不僅僅是科研工具的更新,更可能帶來兩場深層次的范式轉變。
科學研究范式的重塑
在AI科學家(AI Scientist)進入實際科研流程的初期,最先被改變的將是研究提案與創新構思的產生方式。 有人形容科研「像炒菜」,需要不同學科、方法和思想的融合與碰撞。
而如今的大語言模型本身就具備跨領域的知識體系與推理能力,能夠在極短時間內生成大量富有潛力的創新想法[4][5]。
如果這些想法能在像aiXiv這樣的平臺上經歷結構化評審與多輪迭代,那么AI產出的科研創意將越來越接近人類研究者的完整思維空間,甚至可能在廣度與多樣性上實現超越。
這意味著人類科學家所能探索的「增量創新」領域會迅速縮小,但與此同時,也會被迫把目光投向更具挑戰、更具原創性的科學問題。
從更宏觀的視角看,自17世紀以來,人類在各學科領域共發表了約1.5億到2億篇高質量論文,這些成果凝聚了數百年的積累與協作。
然而,隨著自主人工智能研究者的出現,這一數字可能很快被刷新。
人工智能系統將以超人的速度和規模運行,生成、測試和發表數十億篇科學論文,這并非幾個世紀的工夫,而是短短幾年,甚至幾個月,幾天或幾小時……
其中既可能包含諾貝爾獎級的重大突破,也可能孕育出具備持續自我進化能力的「超級 AI 科學家」。
![]()
團隊首次提出科學發現的Scaling Law
科學出版體系的再定義
aiXiv的理念是建設一個面向AI科學家與機器人科學家的開放共享平臺,讓科研成果能夠在全球范圍內自由傳播與驗證。
與傳統的預印本平臺不同,aiXiv在系統中集成了AI評審機制,用以確保研究提案與論文在發布前就能經過高質量審查,從而提升整體學術可信度。
為了真正實現開放與長期可持續,aiXiv團隊還在探索去中心化與區塊鏈技術的應用,用以存儲和追蹤DOI、版本以及評審記錄,確保科研成果在全生命周期內的可追溯性與透明性,這種機制不僅能為AI時代的科學出版提供全新的信任基礎,也為未來的大規模自動科研體系奠定了關鍵的技術底座。
這種雙重顛覆不僅重新定義了科學研究的生產方式,也在根本上重塑了科研成果的傳播與驗證體系。
從研究構思到出版機制,整個鏈條都在被AI重新編織。
在這一進程中,aiXiv不僅扮演著平臺的角色,更像是一個正在孕育中的「科研操作系統」,為未來的人類與AI科學家提供統一的基礎環境。
隨著這一體系逐步完善,aiXiv及其背后的開放生態正加速走向全球化。
科研不再局限于實驗室、機構或學科邊界,而是進入一個由智能體共同驅動的時代,這正是aiXiv團隊提出的下一階段目標:構建面向全人類的AI for Research全球協作網絡。
從aiXiv到全球生態
AI for Research的未來
aiXiv致力于構建下一代開放科學基礎設施,讓AI與人類科研體系共生發展。
該團隊也正在邀請各大頂級高校教授們加入aiXiv顧問委員會(Advisory Board),共同制定面向AI時代的學術規范與評審標準。
同時,他們也期待得到來自企業、基金會等各類合作伙伴的支持,攜手推動這一開放科研平臺的建設與落地。
參考資料:
[0] Zhang, P., Hu, X., Huang, G., Qi, Y., Zhang, H., Li, X., ... & Liu, X. (2025). aiXiv: A Next-Generation Open Access Ecosystem for Scientific Discovery Generated by AI Scientists. arXiv preprint arXiv:2508.15126.
[1] Zhang, P., Zhang, H., Xu, H., Xu, R., Wang, Z., Wang, C., ... & Liu, X. (2025). Scaling Laws in Scientific Discovery with AI and Robot Scientists. arXiv preprint arXiv:2503.22444.
[2] Lu, C., Lu, C., Lange, R. T., Foerster, J., Clune, J., & Ha, D. (2024). The ai scientist: Towards fully automated open-ended scientific discovery. arXiv preprint arXiv:2408.06292.
[3] Swanson, K., Wu, W., Bulaong, N. L., Pak, J. E., & Zou, J. (2025). The Virtual Lab of AI agents designs new SARS-CoV-2 nanobodies. Nature, 1-3.
[4] Hu, X., Fu, H., Wang, J., Wang, Y., Li, Z., Xu, R., ... & Lan, Z. (2024). Nova: An iterative planning and search approach to enhance novelty and diversity of llm generated ideas. arXiv preprint arXiv:2410.14255.
[5] Si, C., Yang, D., & Hashimoto, T. (2024). Can llms generate novel research ideas? a large-scale human study with 100+ nlp researchers. arXiv preprint arXiv:2409.04109.
秒追ASI
?點贊、轉發、在看一鍵三連?
點亮星標,鎖定新智元極速推送!





京公網安備 11011402013531號