王小川繼今年4月發布全員信、表明未來聚焦醫療方向后,8月11日,旗下百川智能發布開源醫療增強大模型Baichuan-M2。
8月8日在GPT-5發布會上,OpenAI首席執行官山姆·奧特曼強調在AI醫療大模型標準HealthBench的測試中,GPT-5得分高于其之前的任何模型。百川智能方面則透露,此次開源的更小尺寸模型實現了醫療能力反超,在所有開源模型中位居世界第一。
![]()
測試排名出自AI醫療大模型標準HealthBench。
據了解,早在今年1月,百川智能就在行業內首發“AI患者模擬器”。據介紹,人類醫生在聽取患者描述病情時,很容易分辨患者描述中的邏輯漏洞、從含混不清的表達中辨別出真實病因。現實中患者幾乎無法全面準確表達自己的癥狀,僅基于靜態的病例、指南等醫療數據訓練,模型無法掌握人類醫生的這一能力,AI患者模擬器就為突破這一瓶頸。
今年1月,百川智能用真實數據構造上萬個不同年齡性別癥狀的AI患者模擬了數百萬次診療過程,并開源了首個醫療增強模型Baichuan-M1。7個月后,百川技術團隊升級迭代了AI患者模擬器,并引入模型端到端強化學習、訓練的Baichuan-M2在HealthBench等評測上取得更大突破。
針對醫療領域用戶隱私考慮下的模型私有化部署需求,百川智能對Baichuan-M2進行了極致輕量化,量化后的模型精度接近無損,可以在RTX4090上單卡部署,相比DeepSeek-R1 H20雙節點部署的方式,成本降低了57倍。針對國產主流芯片的開發和適配,多數醫療機構利用現有硬件條件即可實現快速部署。
百川智能方面還表示,Baichuan-M2醫療能力極大增強后模型通用能力不會下降。據悉,頭部大模型企業主要用數學和代碼數據進行強化學習,百川是首個將醫療數據用作強化學習的中國團隊,同時也驗證了高質量醫療數據對于模型通用能力的增長具有較高價值,M2模型在數學、指令遵循、寫作等通用核心性能上不降反升,因此這個模型也可應用于醫療以外的其他領域。
另外,百川智能方面透露,在中國臨床診療場景的問題評測中,對比GPT系列模型,Baichuan-M2展現出更明顯的可用性優勢。“在一個具體的真實案例中,針對CNLC IIa期(BCLC B期)的肝細胞肝癌患者,Baichuan-M2首推在具備手術條件的情況下進行解剖性肝右葉切除手術(或根據腫瘤具體位置,可考慮擴大右半肝切除、右三葉切除等),目標是R0切除。在國家衛健委最新發布的《原發性肝癌診療指南》(2024版)中,肝切除術是潛在根治性治療,可提供最佳的長期生存獲益,Baichuan-M2嚴格遵循這一方案。”
據悉,目前Baichuan-M2已在北京市海淀區衛健委、北京大學第三醫院、國家兒童醫學中心等一線醫療場景中實測驗證。
采寫:南都N視頻記者 林文琪





京公網安備 11011402013531號