IT之家 12 月 22 日消息,科學領域正迎來一場大規模的論文發表熱潮,這在很大程度上要歸功于人工智能技術。發表于《科學》期刊的一項新研究顯示,在諸多學科領域中,使用 ChatGPT 等大語言模型(LLMs)的科研人員,產出的論文數量顯著增多。該技術也正助力母語非英語的科研人員,讓科研競爭的賽場變得更加公平。

人工智能在科研領域的應用日益廣泛,這引發了人們對粗制濫造研究成果以及機器生成不實內容等問題的擔憂。但這項新分析同時表明,借助大語言模型撰寫的論文,語言表達更為復雜,引用的文獻來源也更為廣泛。
人工智能分析方法
為量化人工智能對科學論文發表的影響,康奈爾大學與加州大學伯克利分校的研究人員,分析了 2018 年 1 月至 2024 年 6 月期間,三大主要預印本論文平臺上發布的近 210 萬篇研究摘要。這些論文均未經同行評審便已對外公開。
據IT之家了解,在開展分析時,研究團隊借助聊天機器人模型 GPT-3.5 Turbo-0125,生成了 2023 年之前發表的論文摘要的人工智能改寫版本。隨后,他們從中提煉出人工智能文本區別于人類文本的特征模式。基于這些發現,團隊開發出一套算法,用以掃描近年發表的論文,通過識別相似特征標記出人工智能輔助撰寫的成果。研究人員還對論文作者進行了長期追蹤,以此衡量他們的論文發表量變化情況。
科研產出大幅增長
研究發現,科研人員使用人工智能工具后,工作效率出現激增。其中,社會科學與人文科學領域的論文產出增幅最大,達到 59.8%;生物與生命科學領域的增幅為 52.9%;而物理學與數學領域的增幅則為 36.2%。研究團隊在報告中指出:“大語言模型的應用,與科研人員的學術產出大幅增長密切相關。”
這項研究中最引人關注的發現之一,是母語非英語國家科研人員的產出量出現了大幅提升。大多數頂級期刊都要求稿件使用高水平英文撰寫,這一要求長期以來讓這類科研人員處于不利地位。但在人工智能分擔部分工作后,亞洲地區的科研人員在部分學科領域的論文產出增幅最高達到 89%。
不過,該研究的作者也針對人工智能與論文質量的關聯發出了警告。盡管人工智能能讓論文的表述顯得更為專業,但這也可能成為一種陷阱。在過去,精湛的寫作水平往往是高質量研究的標志,但如今情況有時會截然相反。研究發現,人工智能生成的文本語言越復雜,論文的質量反而越有可能偏低。換句話說,華麗的文筆可能會掩蓋薄弱的學術觀點。
研究作者傳遞出的核心觀點是:我們不能再僅憑論文的語言文采來評判其質量。“隨著傳統評判標準逐漸失效,期刊編輯與審稿人可能會愈發依賴作者學術背景、所屬機構等身份標識,將其作為衡量論文質量的信號。頗具諷刺意味的是,這會抵消大語言模型在推動科研成果民主化方面發揮的作用。”
為維護科研誠信,研究人員提出了多項舉措建議,其中包括:各科研機構需實施更深入的審核機制,甚至可引入專門的“人工智能審稿智能體”,助力區分文本是由人類撰寫還是由機器生成。





京公網安備 11011402013531號