![]()
新智元報道
編輯:傾傾
微軟在《Cell》公布了最新成果:GigaTIME能把一張H&E切片翻譯成過去稀缺的免疫圖譜,并在人群尺度重建TIME。癌癥免疫研究的許多舊限制,也因此開始松動。
你很難想象,一張醫院里5美元的H&E切片,有一天會被放到《Cell》上,甚至讓微軟CEO親自站出來轉發。
![]()
但就是這樣一張5美元的病理圖,被AI徹底改變了。
AI把它翻譯成了昂貴的、稀缺的、過去根本無法規模化的mIF免疫圖像。
當這種翻譯被執行在14256名患者身上,形成近30萬張虛擬免疫圖譜之后,一個從未出現過的「虛擬人群」被點亮了。
這意味著,癌癥免疫研究第一次擺脫了樣本之痛,有機會去回答那些之前無法回答的問題。
也意味著,醫學的尺度正悄悄發生偏移。
5美元切片的逆襲
當外界把癌癥免疫研究和「昂貴」、「稀缺」畫上等號時,GigaTIME卻用最樸素、最廉價的切片打開了一條全新的通道。
![]()
傳統的multiplex immunofluorescence (mIF),每張切片動輒幾千美元,耗時長、樣本少 。
就算是頂尖實驗室,一年的產出也只能覆蓋整體樣本的極少部分。這就注定了,傳統mIF無法大面積使用。
但醫院每天產生的H&E染色切片,每張只要5~10美元。
幾十年來,它只被當做「常規診斷工具」,沒有人會把它和「高維免疫圖譜」聯想在一起。
GigaTIME改變了這一點。它通過跨模態學習,把H&E里的形態特征翻譯成mIF中的21個蛋白通道,讓本來昂貴、稀缺、無法規模化的免疫信息,復制到每一張普通切片上。
![]()
A–B展示GigaTIME在結構一致性與信號一致性上均顯著優于CycleGAN;C展示虛擬mIF與真實mIF的強相關性(以 DAPI、CK、CD68、CD4為例)
這不是的小把戲,而是「結構性翻譯」:細胞核、細胞質、結構紋理里潛藏的信號,重建成免疫空間里的真實表達。
這就是為什么微軟CEO會在X上親自強調:
AI正在讓我們以前看不見的免疫信息,變得觸手可及。
它向世界證明證明:癌癥研究最貴的那部分,可以從最便宜的部分中「翻譯」出來。
而當這種翻譯被執行成規模時,一個全新的研究世界才開始展開。
分析14256名癌癥患者后,打開新世界的大門
GigaTIME把H&E翻譯成mIF后,發現了一個前所未有的研究窗口。
過去,受限于成本和樣本量,免疫微環境(TIME)往往只能在幾十例、最多上百例病例中觀察。
而這一次,研究團隊把模型應用在14256名癌癥患者身上,橫跨24種癌癥、306個亞型,最終生成了299376張虛擬mIF圖像。
這些病例來自Providence的真實世界臨床醫療體系,橫跨51家醫院,上千家診所。
這使GigaTIME的訓練與驗證扎根現實的土壤,而不是實驗室的無菌環境。
![]()
GigaTIME的整體研究框架。展示了14,000+患者規模的真實世界數據,H&E→虛擬mIF的翻譯流程,以及三大下游任務(生物標志物關聯、患者分層、TCGA 驗證)。
積累十年的數據,一次就被趕超。
這份虛擬人群帶來的第一個成果,是規模化的生物標志物關聯圖譜。
研究者在其中識別出1234個統計學顯著的蛋白質–生物標志物關聯。
![]()
跨癌種的TIME免疫光譜圖。展示不同癌種在21個蛋白通道上的免疫激活差異,涵蓋增殖、免疫檢查點、上皮–間質等功能類別。
其中既包括已有文獻支持的模式,例如MSI高、TMB高通常伴隨TIME相關通道的升高 ;也出現了一些跨癌種的新型關聯,例如與KRAS、KMT2D等驅動突變之間的免疫鏈接 。
更重要的是,這個虛擬人群并非閉門造車。
研究團隊把GigaTIME生成的虛擬mIF與TCGA 10200名患者的數據進行了對照 ,得到了r =0.88的跨數據集一致性。
![]()
Providence vs TCGA的虛擬mIF一致性
這意味著,無論是人群分布、癌種構成還是組織來源完全不同, GigaTIME的免疫翻譯都保持了高度穩健。
微軟研究院將這項工作定義為:全球首個基于空間蛋白質組學的population-scaleTIME研究。
過去,由于mIF稀缺,這類分析大多是理論上存在,如今,GigaTIME把事實擺在我們眼前。
免疫能不能預測疾病?虛擬人群給出答案
接下來的工作,就是驗證:這些被AI翻譯出來的免疫信息,能不能用來判斷疾病?能不能用于臨床指導?
答案比預期更大膽。
研究團隊對近30萬張虛擬mIF做了關聯分析,發現了 1234項統計學顯著的蛋白質–生物標志物關系。
![]()
這些關系橫跨跨癌種、癌種內部和亞型內三個層級。
其中既有文獻驗證的模式,例如MSI-H/TMB-H通常伴隨 CD138、CD4等免疫相關通道普遍上調;
也出現了過去因樣本量不足而無法觀察到的新人群特征,例如KRAS、KMT2D等驅動突變與免疫活化之間的全局關聯。
![]()
虛擬 mIF × 生物標志物的關聯矩陣
這是我們第一次在真實人群尺度上看到癌癥免疫的因果紋理。
研究團隊進一步提出問題:如果把21個虛擬mIF通道組合成一個整體特征,能否用于區分患者的生存風險?
答案是肯定的。
![]()
虛擬mIF的生存分層能力。A–C展示虛擬mIF與病理分期的相關性;D–F顯示CD3、CD8與GigaTIME signature在pan-cancer、肺癌、腦癌中的生存分層表現;G則給出不同蛋白通道對生存預測的重要性排序。
pan-cancer層面,GigaTIME signature能明顯區分生存曲線;
在肺癌和腦癌中,也呈現穩定的分層能力;
虛擬 CD3、虛擬 CD8 的預測效果,與真實CD3/CD8在文獻中的表現高度一致。
綜合21通道的signature性能更優
AI翻譯出來的免疫圖譜不僅「像真的」,而且「能像真的一樣用」。
免疫微環境真正難的一點,在于它是一個復雜的「空間結構問題」。
![]()
虛擬mIF的空間激活圖
這類「免疫模式的合取與并集」在過去只能靠假設推測,現在在虛擬人群中可以直接驗證。
GigaTIME讓免疫微環境的「幾何學」第一次能被系統分析。
GigaTIME學到的不只技巧,還有語言本身
真正讓人相信它的,從來不是它預測得多么準確,而是「它是怎么學會這些的?」
GigaTIME的可信度,其實在它誕生的那一刻就已經定下來了。
mIF價格高昂,一張幾千美元,做研究就像是在燒錢。
H&E則完全相反,5~10美元一張,全球各地都在用它生成、掃描、存檔。
GigaTIME,把這兩種世界接在了一起。
它從4千萬個細胞級別、逐一對應的H&E和mIF中學會了它們之間的語言關系。
更關鍵的是,當模型離開訓練它的那套數據,被放到一個不同醫院體系、不同樣本來源的人群上時,依舊能行為穩定。
![]()
往前走一步,很容易就能發現GigaTIME是站在巨人的肩膀上。
微軟此前的GigaPath已經證明,H&E里藏著極其豐富的結構信號。
GigaTIME只是進一步把這種結構翻譯成免疫,把只有實驗才能看到的東西,放在我們眼前。
也正因如此,前面那些大規模關聯、生存分層、空間結構的發現,才不是模型的幻覺。
它們之所以可信,是因為模型從第一天起就站在真實世界的對照數據上,并不斷在獨立人群上被驗證。
你會感覺它不是「猜得對」,而是真的「聽得懂」。
從一張H&E切片開始,GigaTIME推開了一扇沒人想過的門:
learning the language of patients.
意思是,醫學終于有機會,把看得見的東西,延伸成真正能讀懂病人的語言。
它不是終點,更像是虛擬患者時代的第一塊基石。
當免疫圖譜能在幾十萬人的尺度上重建,未來關于疾病的預測、治療反應的推演,可能都不止停留在猜測。
如今,GigaTIME已在Foundry Labs與HuggingFace全量開源,這意味著它的優勢不再屬于少數團隊,而將成為整個醫學界都能繼續構建的基礎能力。
新的故事,也許就會從這里開始。
參考資料:
https://x.com/satyanadella/status/1998424249611211263
https://www.microsoft.com/en-us/research/blog/gigatime-scaling-tumor-microenvironment-modeling-using-virtual-population-generated-by-multimodal-ai/
https://www.cell.com/cell/fulltext/S0092-8674(25)01312-1
秒追ASI
?點贊、轉發、在看一鍵三連?
點亮星標,鎖定新智元極速推送!





京公網安備 11011402013531號