![]()
智東西
作者 王涵
編輯 漠影
智東西8月28日報道,最近網上有一個詞特別火,叫“邪修”。
通俗來講就是“不走尋常路”,跳出傳統方法或步驟,卻能簡單高效地達成目的。
那科研能不能“邪修”呢?
前幾天,一個還在讀材料研究生的朋友跟我聊天,提到他們實驗室里的新生都在“邪修做實驗”。
具體說來就是,用AI幫忙總結文獻,把實驗結果輸給AI讓其幫忙做數據分析,還能讓AI根據分析結果生成下一步實驗改進方法,得到的結果又快又好。
現在帶動他們整個實驗室都在用AI,當然老師也知道這個情況,但基本屬于默許狀態,還曾感嘆真是生錯了時代。
究竟是什么AI這么好用?他給我甩來一個鏈接,還說你試試就知道了。我點開一看,這是一個科學多模態大模型,叫做『書生』Intern-S1。
為了驗證它的能力,我特意翻出了此前所做實驗的相關圖表,拍照發給Intern-S1,并問它:這副材料表征圖可以顯示出鈣鈦礦LED薄膜的哪一特性?右圖和左圖在這一特性上有什么不同?
![]()
Intern-S1在很短的時間內就判斷出該幅圖片是原子力顯微鏡(AFM)的三維形貌圖,并且對該圖進行了詳細的解讀,列出了對比表格。此外,Intern-S1還生成了對該實驗品的未來改進方向,可以給科研人員拓寬實驗改進思路。
值得一提的是,在精準識別化學分子結構并進一步給出科研建議方面,Intern-S1表現比Grok還出色。
我給了Intern-S1一張圖,并提問:這個分子式含有Cs、Pb和Br三種元素,根據此分子結構圖,寫出該化學物質的分子式,并介紹其有什么樣的化學性質,目前有哪方面的應用?
![]()
作為對比,我也讓Grok回答了一下這個問題:
![]()
可以看到,Grok只是中規中矩地回答問題,并沒有做更多的延展,但Intern-S1還特別生成該化合物研究領域目前所遇到的挑戰,以及未來改進方向,站在了一個科研人的角度思考問題,預判了我的下一步動作。
除了科研外,我也順帶看了一下它在藝術領域的表現。我把梵高的畫作《星空》發給Intern-S1,讓它從科學的邏輯和知識體系進行理性賞析:
![]()
當然也還可以這么用,比如給理工直男解釋防曬霜和隔離液、粉底液的區別:
![]()
再比如,我還能讓Intern-S1給我看食品配料表,判斷其是否適合減脂期食用:
![]()
對于我的提問,Intern-S1在分鐘內就給出了準確答案,相對于教科書和學術論文語言的晦澀,Intern-S1的回答簡潔明了、通俗易懂,并且在其他模型還在專注于如何精準地回答問題時,Intern-S1已經可以用科研人的思維進一步思考了,在科學專業知識這方面,確實能打。
Intern-S1的輕量化版本Intern-S1-mini也在前幾天問世了,mini版本只有8B參數但同樣兼具通用能力與專業科學能力,且更加適合快速部署和二次開發。
![]()
目前,Intern-S1和Intern-S1-mini都已經開源,Hugging Face上顯示Intern-S1的下載量有5萬多,Intern-S1-mini的下載量也有1000多,非常受歡迎,感興趣的可以去試一試:
體驗頁面:
https://chat.intern-ai.org.cn/
GitHub:
https://github.com/InternLM/Intern-S1
HuggingFace:
https://huggingface.co/internlm
ModelScope:
https://modelscope.cn/models/Shanghai_AI_Laboratory
當然,科學大模型不算是一個新鮮事物。在近幾年,同類型的、專注于科學的大模型也層出不窮。上海AI實驗室的這一成果為什么能實現這樣的差異化?
帶著這樣的疑問,我深扒了Intern-S1背后的技術路線和應用成果,并與上海AI實驗室的青年領軍科學家陳愷進行了一場深度訪談,最終我得到了答案。
一、AlphaFold破解50年蛋白質難題,AI+Science進入快車道
要講科學大模型,最繞不開的就是AI for Science這個話題,這就不得不提到2024年的諾貝爾化學獎。
2024年,諾貝爾化學獎公布將其一半頒給計算蛋白質設計方面的研究者David Baker,另一半則授予了共同開發了AlphaFold的谷歌DeepMind CEO德米斯·哈薩比斯(Demis Hassabis)和John Jumper。
AlphaFold,特別是其在2020年發布的AlphaFold2版本,利用深度學習和人工智能技術,以前所未有的準確性和速度預測蛋白質的三維結構。這使得原本需要數月甚至數年才能完成的蛋白質結構解析工作,現在可以在幾小時甚至幾分鐘內完成,并且準確度可以媲美甚至在某些情況下超越傳統方法。
AI可以通過分析數百萬個已知的蛋白質結構和序列數據庫進行訓練,從而能夠從僅有的氨基酸序列推斷出蛋白質的折疊方式。
其實在此之前,AI for Science就已經引起學術和行業的關注。2019-2023年間,全球AI for Science論文發表年均增長率為27.2%,各學科領域論文發表均呈現逐年遞增趨勢,其中生命科學、物理學和化學等領域發表的人工智能應用論文數量最多。
中美兩國是當前AI for Science研究大國,近5年間,中國論文發表超過10萬篇,居全球第一。
但24年諾貝爾化學獎的公布,再次證明了人工智能技術在推動科學進步方面所扮演的關鍵角色,尤其是通過像AlphaFold這樣的突破性應用,不僅加快了科學研究的步伐,還拓寬了我們對生命科學、物理學和化學等領域內復雜問題的理解。
隨著全球范圍內AI for Science的熱度持續升溫,越來越多的研究者和機構開始探索如何利用人工智能來解決更多基礎科學難題。
在這一背景下,『書生』科學多模態大模型Intern-S1應運而生。
值得關注的是,在開源策略層面,上海AI實驗室比谷歌DeepMind更“豪爽”。
Intern-S1發布即開源。除了基礎模型外,上海AI實驗室還一口氣開源了大模型研發與應用所需的全鏈路工具體系,并已構建擁有數十萬活躍開發者的開源社區。
谷歌DeepMind AlphaFold3從發布到開放相隔長達半年,且僅為部分開放:模型權重需申請獲取,商業用途受限。
二、主打多模態和通專融合,化學、材料、地球科學全面超越Grok-4
相較于同類科學大模型,Intern-S1有2個突出的特別之處,那就是多模態和“通專融合”。
據了解,在綜合多模態通用能力評估中,Intern-S1的得分和國內外一流模型不相上下,能同時較好地理解文本和圖像內容。該評估為多項通用任務評測基準均分,這樣的結果說明它在不同場景任務中,既有穩定的表現,也能適應復雜情況。
![]()
而在由多個領域專業評測集組成的科學能力測試里,Intern-S1的表現超過了Grok 4等最新的閉源模型。這些評測涉及物理、化學、材料、生物等領域的復雜專業任務,進一步證實了Intern-S1在科研場景中具備較強的邏輯性和準確性。
![]()
Intern-S1是怎么在多模態領域答出這樣的高分答卷的?
陳愷告訴智東西,原來,Intern-S1新增了動態Tokenizer和時序信號編碼器,實現了支持多種復雜科學模態數據處理的功能,所以才能夠實現材料科學與生物制藥、天文巡天、天體碰撞、地震臺網記錄的地震波形等多類科學模態進行深度融合。
![]()
此外,Intern-S1通過架構上的創新,對科學模態數據的理解和處理效率有了明顯提高。比如,它對化學分子式的壓縮率比DeepSeek-R1要高出70%以上。在一系列基于科學模態的專業任務中,Intern-S1不僅用的算力更少,表現也更出色。
之前市場中的科學大模型,或者說專業領域的行業大模型,通常都會強調自己過硬的專業能力,而在Intern-S1發布會上,“通專融合”這個詞出現頻率很高。
當被問到上海AI實驗室專注走“通專融合”技術路線的原因時,陳愷解釋稱:“通專融合的技術路線,能讓模型在通用能力保持的同時做到專業能力精進,把垂類能力構建成本大幅降低。”
![]()
智東西了解到,一方面,Intern-S1會借助大量通用科學數據來拓寬自身的知識范圍;另一方面,它還會訓練多個專業模型,生成那些容易理解、邏輯清晰的科學數據,并且通過為特定領域定制的專業驗證智能體來把控這些數據的質量。
這種閉環的運作方式不斷為其基座模型提供支持,讓Intern-S1既能擁有強大的通用推理能力,又具備多項專業能力,從而實現了“一個模型就能解決多項專業任務”這一科學智能領域的突破。
跳出技術角度,陳愷特別補充,科學領域的前沿突破,往往需要不同專業能力的交叉融合遷移,通專融合能更好促進未來科學發現。
陳愷還介紹,Intern-S1的研發團隊在訓練系統和算法兩方面一起下功夫搞創新,成功讓大型多模態MoE(混合專家)模型在FP8精度下,能高效又穩定地進行強化學習訓練,而且訓練成本比最近公開的其他MoE模型低了10倍。
從系統層面來看,Intern-S1用了訓推分離的RL方案,靠自己研發的推理引擎來進行FP8精度的大規模異步推理,效率很高;還通過數據并行均衡策略,減輕了長思維鏈解碼時出現的長尾問題。訓練的時候用了分塊式FP8訓練,效率提升不少,這套訓練系統之后也會開源。
再看算法方面,基于Intern·Bootcamp搭建的大規模多任務交互環境,研發團隊提出了“Mixture of Rewards”混合獎勵學習算法,能把多種獎勵和反饋信號融合到一起,聽起來有點像“因材施教”。
比如在容易驗證的任務上,就用RLVR模式來訓練,通過規則、驗證器或者交互環境來提供獎勵信號;而像對話、寫作這類不好驗證的任務,就用獎勵模型給出的獎勵信號來一起訓練。
三、能查科研數據,還能聯機實驗設備,科學發現平臺同步推出
在落地應用上,智東西發現,以Intern-S1為底座的『書生』科學發現平臺Intern-Discovery也同步推出了。
Intern-Discovery以Intern-S1為核心,整合了專業智能體、海量科研數據及實驗設備,可以給全球研究者提供從假設到驗證的一站式科研支撐,目前平臺已開放全球試用申請。
![]()
陳愷向智東西透露,實驗室非常歡迎與各大高校和研究所等機構進行深度合作。
根據公開信息,在Intern-Discovery的基礎上,上海AI實驗室聯合臨港實驗室、上海交通大學、復旦大學、MIT等研究機構,共同參與構建了多智能體虛擬疾病學家系統“元生”(OriGene)。
在治療癌癥上,OriGene的作用非常大。目前,其僅用了兩個月就已在肝細胞癌和全球第三大癌癥的結直腸癌治療上分別提出兩個新靶點GPR160和ARG2,并已在臨床樣本、類器官和人源化動物實驗中得到驗證。
結語:Intern-S1展現AI賦能科學新圖景
隨著技術的持續迭代,科研人員與AI工具的協同將進一步深化。通用大模型與專用模型的優勢互補,可能在更多科學領域發揮作用。
Intern-S1所采用的“通專融合”技術路徑,為平衡模型的通用性與專業性提供了一種實踐方案,AI技術與科學研究的結合不斷拓展著科研手段的邊界。





京公網安備 11011402013531號