
百川智能創(chuàng)始人、CEO 王小川
時(shí)隔許久,王小川創(chuàng)立的百川智能公布最新模型技術(shù)進(jìn)展。
8月11日消息,百川智能今天發(fā)布一款開(kāi)源的醫(yī)療增強(qiáng)大模型Baichuan-M2。
具體來(lái)說(shuō),針對(duì)醫(yī)療領(lǐng)域用戶隱私考慮下的模型私有化部署需求,百川智能對(duì)Baichuan-M2進(jìn)行了極致輕量化,量化后的模型精度接近無(wú)損,可以在RTX4090上單卡部署,相比DeepSeek-R1 H20雙節(jié)點(diǎn)部署的方式,成本降至其成本的1/57。針對(duì)國(guó)產(chǎn)主流芯片的開(kāi)發(fā)和適配,讓多數(shù)醫(yī)療機(jī)構(gòu)利用現(xiàn)有硬件條件可以實(shí)現(xiàn)快速部署。
評(píng)分上,Baichuan-M2在HealthBench上得到60.1的高分,以32B的較小尺寸不僅反超OpenAI 最新開(kāi)源模型gpt-oss120b(得分57.6),超過(guò)Qwen3-235B、Deepseek R1、Kimi K2等其他開(kāi)源大模型,略遜于GPT-5-Thinking。

百川智能表示,GPT-5發(fā)布時(shí)既沒(méi)有開(kāi)源,也沒(méi)有公布參數(shù),無(wú)法私有化部署,無(wú)法低成本應(yīng)用。相比之下,Baichuan-M2快速免費(fèi)開(kāi)源,成為醫(yī)療行業(yè)低成本快速應(yīng)用部署世界頂尖醫(yī)療模型的唯一選擇。
據(jù)悉,百川智能成立于2023年3月,由原搜狗公司CEO王小川創(chuàng)立,團(tuán)隊(duì)成員主要來(lái)自搜狗、谷歌、騰訊、百度、微軟、字節(jié)等公司。目前,百川智能已完成三輪融資,2024年7月獲得了50億元的A輪融資,并將以200億元估值開(kāi)啟B輪融資,是中國(guó)AI“大模型六虎”之一。
今年以來(lái),百川智能全面做“AI醫(yī)生”。
王小川稱,醫(yī)療大模型是LLM皇冠上的明珠,AI醫(yī)療不僅能提升醫(yī)療服務(wù)的可及性、便利性,還將推動(dòng)醫(yī)療研究范式的創(chuàng)新。在智能時(shí)代,我們不是在造“工具”而是在“造人”,造人代表了知識(shí)含量最高,并且需求最廣泛,而醫(yī)療則是其中最有代表性的行業(yè)。神經(jīng)網(wǎng)絡(luò)之父辛頓(Hinton)也強(qiáng)調(diào)了醫(yī)療的重要性,認(rèn)為“醫(yī)療行業(yè)是AI應(yīng)用中最重要的領(lǐng)域之一,能最大化發(fā)揮AI的潛力”。
“為生命建模型、為人類造醫(yī)生,是百川的使命。這是第一天就立下的志向。”王小川曾指出,百川智能是國(guó)內(nèi)唯一一個(gè)專注醫(yī)療的大模型創(chuàng)業(yè)公司。其在2021年把搜狗公司賣(mài)給騰訊的時(shí)候就提到,之后的二十年我會(huì)專注生命科學(xué)、大眾健康。2022年,他創(chuàng)建了一家做AI檢驗(yàn)檢測(cè)設(shè)備的公司——五季醫(yī)學(xué),它和百川智能實(shí)際上是姊妹公司。
今年1月,百川智能推出國(guó)內(nèi)首個(gè)具備語(yǔ)言、視覺(jué)和搜索三大推理能力的開(kāi)源全場(chǎng)景模型Baichuan-M1-preview,特別解鎖了醫(yī)療循證模式,可整合實(shí)時(shí)醫(yī)學(xué)證據(jù)進(jìn)行深度推理,同期開(kāi)源的Baichuan-M1-14B醫(yī)療增強(qiáng)模型,在臨床評(píng)測(cè)中表現(xiàn)媲美主流大模型(如o1-mini)。
同時(shí),百川Baichuan-M1-preview內(nèi)置行業(yè)內(nèi)首發(fā)的AI患者模擬器,用真實(shí)數(shù)據(jù)構(gòu)造上萬(wàn)個(gè)不同年齡性別癥狀的AI患者,模擬了數(shù)百萬(wàn)次診療過(guò)程。
今年2月,以Baichuan M1大模型為底座打造的“AI兒科醫(yī)生”正式在北京兒童醫(yī)院上崗;今年3月,百川攜手北京兒童醫(yī)院、小兒方健康共同發(fā)布“福棠百川”兒科大模型。
時(shí)隔8個(gè)月后,百川智能發(fā)布全新大模型產(chǎn)品,升級(jí)患者模擬器并引入模型端到端強(qiáng)化學(xué)習(xí)(RL)能力。
百川智能表示,面向急診、門(mén)診等對(duì)于交互速度要求更高的場(chǎng)景,相比Baichuan-M1,基于Eagle-3架構(gòu)優(yōu)化的Baichuan-M2 MTP版本在單用戶場(chǎng)景下實(shí)現(xiàn)了58.5%的token速度躍升。
實(shí)際上,OpenAI于8月6日首次開(kāi)源兩款大模型,主打部署成本超低和醫(yī)療能力最強(qiáng)。其中,開(kāi)源gpt-oss系列模型過(guò)程中,OpenAI首次將醫(yī)療作為第一重要的評(píng)測(cè)標(biāo)準(zhǔn);發(fā)布GPT-5時(shí),請(qǐng)到現(xiàn)場(chǎng)的唯一使用者是抗癌患者。
據(jù)悉,OpenAI從HealthBench整體數(shù)據(jù)中選出1000個(gè)特別困難復(fù)雜問(wèn)題作為Hard子集,用于驗(yàn)證模型多維度、全景化解決疑難復(fù)雜醫(yī)學(xué)問(wèn)題的能力。今年5月這個(gè)評(píng)測(cè)集發(fā)布時(shí),世界上所有頂尖模型得分都沒(méi)超過(guò)32分,許多前沿模型得分甚至為0。在OpenAI組織的人類資深醫(yī)生測(cè)試中,資深醫(yī)生撰寫(xiě)的答案甚至未超過(guò)o3。
OpenAI在GPT-5發(fā)布時(shí)特別強(qiáng)調(diào),其是HealthBench Hard評(píng)測(cè)全球唯一超過(guò)32分的模型。而百川智能表示,Baichuan-M2以34.7分成為全球第二款超過(guò)32分的模型。
案例方面,百川智能稱,在北京市海淀區(qū)衛(wèi)健委、北京大學(xué)第三醫(yī)院、國(guó)家兒童醫(yī)學(xué)中心等合作伙伴的支持下,M2在真實(shí)病例實(shí)測(cè)中體現(xiàn)出超強(qiáng)能力。例如,一位51歲女士近兩個(gè)月睡眠充足仍感覺(jué)困倦、疲憊,脖子輕微腫脹。M2根據(jù)醫(yī)患對(duì)話,詳細(xì)梳理出持續(xù)性疲勞、體重增加等多個(gè)支持診斷的關(guān)鍵癥狀,綜合考慮患者用藥史、年齡、合并癥狀等因素,精準(zhǔn)診斷出患者最可能病因?yàn)榧谞钕俟δ軠p退癥。
事實(shí)上,近期,螞蟻、字節(jié)等大廠都在布局“AI醫(yī)生”這一前沿產(chǎn)業(yè)賽道。
其中,7月初,字節(jié)跳動(dòng)推出首個(gè)AI醫(yī)療助手獨(dú)立App“小荷AI醫(yī)生”,主打健康咨詢與報(bào)告解讀功能;而螞蟻集團(tuán)也上線獨(dú)立健康應(yīng)用“AQ”,加速布局AI醫(yī)療賽道。
據(jù)弗若斯特沙利文預(yù)測(cè),中國(guó)AI醫(yī)療市場(chǎng)規(guī)模將從2023年的88億元,快速增長(zhǎng)至2033年的3157億元,年復(fù)合增長(zhǎng)率高達(dá)43.1%。





京公網(wǎng)安備 11011402013531號(hào)