亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

7B模型對標GPT-4o,全球首個醫療代碼生成大模型訓練平臺來了

IP屬地 中國·北京 編輯:馮璃月 量子位 時間:2025-07-13 14:18:59

德克薩斯大學西南醫學中心團隊投稿 發自 凹非寺
量子位 | 公眾號 QbitAI

醫療AI場景復雜,需要“又懂醫療又懂編程”的agent。

但像GPT這樣現成的大模型難以直接部署,該如何突破技術壁壘?

答案是:打造一個統一的訓練平臺,專門訓練能夠生成醫療代碼的大模型。

最近,來自埃默里大學、佐治亞理工學院、耶魯大學和德克薩斯大學西南醫學中心的研究團隊,發布了全球首個專注于醫療代碼生成的大模型訓練平臺——MedAgentGym。



該平臺不僅提供了全面的評估基準,更重要的是建立了完整的訓練生態系統,能夠系統性提升大模型在醫療領域的代碼生成和推理能力。

實驗結果表明,經過MedAgentGym訓練的開源模型Med-Copilot-7B在多項醫療編程任務上達到了與GPT-4o相當的性能水平。

醫療AI的”編程瓶頸”

當前醫療AI應用面臨著一個關鍵技術挑戰:如何讓AI系統自動生成可靠的醫療相關代碼。

無論是處理電子健康記錄(EHR)查詢、生物信息學分析,還是構建臨床決策支持系統,都需要精確的編程能力作為支撐。

然而,現有解決方案存在明顯局限:

商業模型的現實困境

- 數據隱私風險:醫療數據的敏感性使得直接調用商業API存在合規風險
- 成本壓力:大規模醫療應用的API調用費用難以承受
- 部署限制:無法在本地或私有云環境中靈活部署

開源模型的能力短板

- 專業知識不足:缺乏深度的醫學領域知識
- 編程能力有限:在復雜的醫療編程任務上表現不佳
- 訓練資源缺乏:缺少專門的醫療代碼訓練數據和環境

研究表明,引入編程能力可以顯著提升模型在計算醫療推理任務上的表現。在MIMIC-III、eICU和MedCalcBench等數據集中,基于代碼的計算推理成功率遠高于傳統的自然語言推理方法。



在MIMIC-III、eICU和MedCalcBench三個數據集中,基于代碼的計算推理(橙色)成功率遠高于傳統的敘述式推理(藍色)。

MedAgentGym:突破性的解決方案



與其他基準相比,MedAgentGym提供了集成了可執行環境、交互式反饋和任務隔離運行設施的編碼訓練平臺。為了解決這一系列挑戰,MedAgentGym提供了一個前所未有的綜合性解決方案。該平臺的核心創新體現在三個維度:

大規模真實醫療任務集合

MedAgentGym整合了來自12個真實生物醫學場景的72,413個編程任務實例,覆蓋129個不同類別。

任務范圍橫跨四大核心領域:
- 結構化醫療信息檢索:如EHR數據庫查詢、臨床記錄分析
- 醫療數據科學:包括統計分析、臨床計算等
- 生物信息學建模:涵蓋序列分析、系統發育學等
- 機器學習應用:臨床預測、風險評估等

數據模態極其豐富,包含臨床筆記、實驗室報告、EHR表格、生物序列等多種格式,全面考驗模型的綜合處理能力。



高效可擴展的訓練基礎設施

MedAgentGym在技術架構上實現了多項突破:

- 容器化隔離環境:每個任務都封裝在獨立的Docker容器中,預裝所有依賴項,確保環境安全性和可復現性
- 交互式反饋機制:當代碼執行出錯時,系統能將錯誤信息轉化為結構化的自然語言反饋,幫助模型進行調試和優化
- 并行處理能力:集成Ray和Joblib等后端引擎,支持大規模并行軌跡采樣和訓練



在擁有交互式調試能力時(藍色),gpt-4.1-mini模型的性能遠高于移除該能力后(橙色)的表現,證明了MedAgentGym交互式環境的巨大價值。

此外,錯誤類型分析揭示了當前模型在復雜醫療代碼任務中面臨的主要挑戰。其中,“陷入循環”不能成功debug是最主要的錯誤類型,占比高達50.39%。

全面的模型評估體系

研究團隊系統性評估了超過25個主流大模型,包括:

API商業模型:GPT系列開源通用模型:Qwen、LLaMA、Gemma等專業編程模型:Qwen2.5-Coder等醫療領域模型:HuatuoGPT、MedReason等

評估結果揭示了商業模型與開源模型之間的顯著性能差距,為后續優化指明了方向。



MedAgentGym零樣本(Zero-shot)測試集結果詳細列出了超過25個前沿大模型在8個不同任務上的原始得分,是評估各模型在醫療代碼生成領域綜合實力的核心依據。

Med-Copilot:開源模型的逆襲之路

基于MedAgentGym平臺,研究團隊開發了Med-Copilot系列模型,并取得了突破性成果。

訓練策略: 采用兩階段精細化訓練框架:

- 監督微調(SFT):使用2,137個成功執行的代碼軌跡進行初始訓練
- 強化學習優化(DPO):通過偏好優化進一步提升性能

性能突破

Med-Copilot-7B通過SFT訓練,性能提升36.44%
結合DPO后,總體性能提升達到42.47%
最終在MedAgentGym基準上達到59.90分,接近GPT-4o的性能水平

關鍵技術創新

研究團隊還訓練了一個AI驗證器(Verifier),能夠從多次代碼生成嘗試中自動識別最佳解決方案。實驗顯示:

在16次嘗試中,模型的潛在成功率可達45%AI驗證器能夠以42%的準確率識別出正確答案僅有3%的差距證明了驗證器的可靠性



僅使用SFT、僅使用DPO以及SFT與DPO結合的策略對7B和14B基礎模型性能的提升效果,驗證了SFT+DPO兩階段訓練框架的有效性。

可持續進化的藍圖:自我提升與性能擴展

MedAgentGym不僅展示了一次性的成功,更揭示了一條可持續進化的清晰路徑。其中的關鍵,在于一個強大的“AI裁判”(即驗證器,Verifier)。

性能具備高度可擴展性

研究團隊讓模型對同一個任務進行多次嘗試(最多16次),并讓“AI裁判”從這些嘗試中選出最佳答案。結果令人驚喜:

- 潛力上限 (Pass@k):在16次嘗試中,模型只要有一次成功,就算解出。在這種理想情況下,成功率從單次嘗試的17%飆升至45%。這說明模型本身具備解決問題的潛力。
- 實際表現 (Best@k):更關鍵的是,在“AI裁判”的幫助下,從這16次嘗試中自動選出的最佳答案,其實際成功率高達42%!

僅有3%的微小差距證明,這個AI裁判的眼光極其“毒辣”,能夠非常可靠地識別出正確的解決方案。這一成果意義重大,因為它意味著這個驗證器已經足夠強大,可以作為獎勵模型(Reward Model)賦能給PPO、GRPO等更先進的在線強化學習框架,為訓練出更強大的醫療AI鋪平了道路。

- 無論是增加訓練數據量,還是在推理時增加嘗試次數(Rollouts),模型的最終成功率都表現出穩定、顯著的提升。這為未來進一步提升模型性能指明了方向:更多的計算投入和數據積累,將帶來更強大的醫療AI智能體。



推理時增加嘗試次數(k)能提升成功率(Pass@k);此外,顯示增加訓練數據量也能穩定提升模型表現。

- 模型可以自我提升:這種強大的驗證能力也解鎖了模型的自我提升:AI智能體可以通過“拒絕采樣+迭代DPO”的自我改進循環,利用自己生成的軌跡數據進行持續學習和優化,不斷突破性能上限 (3-5%)。



通過“拒絕采樣SFT”和兩輪DPO的自我改進循環,模型性能得以持續增長。

未來展望:加速醫療AI的普惠化進程

MedAgentGym的發布,為醫學的AI和大語言模型智能體的研究者和開發者提供了一個強大工具。它通過提供一個統一、開放、可擴展的平臺,填補了醫療代碼智能體開發領域的關鍵空白。

通過將真實世界的生物醫學任務、高效可復現的基礎設施以及對前沿模型的大規模基準測試相結合,MedAgentGym為推動LLM在醫療領域的應用奠定了一個堅實的基礎。

研究團隊希望,MedAgentGym能夠激發更多創新,促進高效、可靠、臨床接地的AI智能體的發展,最終為現實世界的醫療研究與實踐提供支持。

有理由相信,在MedAgentGym的助力下,一個能夠從成功中學習、從失敗中進化的,更加智能和高效的未來醫療新時代,正加速到來。

論文鏈接:https://arxiv.org/abs/2506.04405

項目主頁:https://wshi83.github.io/MedAgentGym-Page/

代碼鏈接:https://github.com/wshi83/MedAgentGym

數據及模型:https://huggingface.co/MedAgentGym

免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

欧美一区二区福利在线| 欧美不卡三区| 国产在线一卡二卡| 日韩一区二区福利| 午夜视频在线免费看| 国产精品天干天干在线综合| 亚洲a中文字幕| 国产一区二区三区蝌蚪| 久久亚洲中文字幕无码| 亚洲激情图片一区| 极品蜜桃臀肥臀-x88av| 国产欧美在线视频| 欧美综合一区二区三区| 日韩精彩视频在线观看| 日本人dh亚洲人ⅹxx| 国产精品久久久久久久久影视| 99精品在线观看视频| a级网站在线观看| 亚洲综合男人的天堂| 波多野结衣办公室双飞 | 美女又爽又黄视频毛茸茸| 一区二区三区高清不卡| 日本aa在线观看| 99久久99久久精品免费观看| 在线免费观看成年人视频| 中文字幕亚洲字幕| 国产免费不卡av| 国产69精品久久久久9999apgf| 色婷婷综合久久久| 日韩va亚洲va欧美va久久| 久久精品一区二区三区四区五区| 日本不卡在线播放| 久久久久久一二三区| x88av在线| 成人福利视频在线观看| 国产午夜精品一区二区三区视频| 日韩大片一区二区| 国产精品乱码人人做人人爱| 欧美色图亚洲激情| 欧美一级大片视频| 国产美女视频一区| 亚洲精品无码国产| 欧美三日本三级三级在线播放| 国产欧美小视频| 欧美国产欧美亚洲国产日韩mv天天看完整 | 风间由美久久久| 豆国产96在线|亚洲| 天天躁日日躁aaaa视频| 91高清视频免费| 北岛玲一区二区三区四区| 亚洲啪av永久无码精品放毛片 | 日本一本二本在线观看| av一区观看| 色一情一乱一区二区| 日本一区二区成人| 国产又粗又大又爽视频| 手机在线播放av| 777精品视频| 北岛玲一区二区三区四区| 亚洲精品乱码久久久久久蜜桃图片| 91成人国产在线观看| 国产亚洲欧美中文| 国产一级不卡毛片| 久久精品国产清自在天天线| 中文字幕乱码日本亚洲一区二区| 中文字幕在线欧美| 激情小说网站亚洲综合网| 在线观看欧美日本| 色综合免费视频| 成人有码视频在线播放| 亚洲一二三专区| 亚洲中文字幕无码爆乳av| 麻豆免费在线观看视频| 成年人三级视频| 国产精品偷伦视频免费观看国产| 亚洲欧美一区二区三区四区 | 91福利视频网站| 午夜成人鲁丝片午夜精品| 1314成人网| 51ⅴ精品国产91久久久久久| 国产精品久久综合| 69视频免费看| 在线观看av的网址| 日韩精品一区二区三区三区免费 | 久久国产亚洲精品无码| 欧美激情免费观看| 亚洲欧美日韩一区二区| 中文字字幕在线中文乱码| 无码人妻少妇伦在线电影| 91成人看片片| 久久黄色网页| 男人的天堂官网| 午夜视频在线瓜伦| 亚洲高清在线观看一区| 国产热re99久久6国产精品| 综合国产在线视频| 欧美日韩中文国产| 91免费视频观看| 国产成人自拍偷拍| 日韩大片一区二区| 国产成人精品日本亚洲| 欧美日韩一级片在线观看| 另类欧美日韩国产在线| 久久高清内射无套| 91亚洲永久免费精品| 亚洲一区影音先锋| 美女一区二区三区| 六月丁香激情综合| 一本色道久久综合亚洲精品图片| 日韩免费在线播放| 91精品国产麻豆国产自产在线| 精品一区二区三区免费观看| 高清在线观看免费| 欧美精品videossex88| 一区二区三区在线观看国产| 欧美激情综合五月色丁香小说| 亚洲精品成人久久电影| 精品国产乱码久久久久久丨区2区| 午夜影院免费版| 国产农村老头老太视频| 一区二区三区 在线观看视频| 蜜臀久久99精品久久久无需会员| 妞干网这里只有精品| 欧美在线视频第一页| 国产成人综合精品三级| 亚洲成人1234| 欧美一区二区福利| av片在线免费看| 国产精品18久久久| 亚洲高清久久网| 欧美日韩精品不卡| 任我爽在线视频| 国产成人在线网站| 日韩成人激情视频| 日韩精品一区二区三区丰满| 波多野结衣喷潮| 成人免费视频一区| 亚洲欧美在线第一页| 欧美二区在线| 永久免费看片直接| 99精品国产热久久91蜜凸| 亚洲欧洲午夜一线一品| 亚洲砖区区免费| 久久综合成人网| 国产欧美日韩卡一| 欧美成人精品在线| 99爱视频在线| 国产又粗又猛又爽又黄91| 香蕉av福利精品导航| 国产精品精品视频| 欧美一级大片免费看| 午夜影院免费视频| 欧美顶级少妇做爰| 久久久久九九九| 青青操在线视频观看| 91色九色蝌蚪| 久久亚洲影音av资源网| 精品这里只有精品| 国产在成人精品线拍偷自揄拍| 五月婷婷综合网| 国产女同一区二区| 欧亚乱熟女一区二区在线| 看国产成人h片视频| 亚洲国产91精品在线观看| 永久久久久久| 在线免费黄色av| 一二三四区精品视频| 国产精品成人播放| 五月天丁香社区| 国产真实精品久久二三区| 精品一区二区三区三区| 三级在线免费观看| 波多野结衣黄色| 精品女同一区二区三区在线播放 | 日本一区二区网站| 亚洲日本中文字幕区| 欧洲精品毛片网站| 女性生殖扒开酷刑vk| 国产一区二区三区在线观看免费视频 | 日本高清成人免费播放| 成人免费视频视频在| 国产大屁股喷水视频在线观看| 26uuu国产日韩综合| 欧美激情图片区| 激情五月婷婷基地| 快she精品国产999| 亚洲二区在线播放视频| 国产911在线观看| 亚洲天堂中文网| 欧美视频第二页| 日本一区免费观看| 亚洲黄色激情视频| 第一福利永久视频精品| 国产精品对白一区二区三区| 乱h高h女3p含苞待放| 国产精品福利av| 国产精品情侣自拍| 女人黄色一级片| 国产精品美女一区二区在线观看| 国产99久久久欧美黑人| 一卡二卡三卡四卡| 久久噜噜亚洲综合| 日本不卡免费高清视频| 国产精品边吃奶边做爽| k8久久久一区二区三区| 久久久久久久久国产精品| 黄页网站在线看| 国产不卡一区视频| 色综合男人天堂| 深夜视频在线观看| 国产精品一区二区果冻传媒| 插插插亚洲综合网| 成人一区二区三区仙踪林| 成人综合在线观看| 97热精品视频官网| 人妻丰满熟妇av无码久久洗澡| 91免费版在线| 国产精品99久久99久久久二8| 男人操女人动态图| 国产农村妇女精品| 国产欧美婷婷中文| 丝袜美腿小色网| 亚洲成人动漫在线观看| 国产综合18久久久久久| 六月丁香在线视频| 欧洲色大大久久| 在线国产精品网| 99久久精品国产成人一区二区 | 国产成人在线视频网站| 久久久久久成人| 欧美做受喷浆在线观看| 亚洲国产精品成人久久综合一区| 国产在线日韩在线| 激情四射综合网| 色综合亚洲欧洲| 夜夜爽99久久国产综合精品女不卡 | 久久久精品视频国产| 成人精品视频一区二区三区| 538国产精品视频一区二区| 久久只有这里有精品| 亚洲三级在线免费观看| 国产精品裸体一区二区三区| www五月天com| 日韩久久久久久| 久久久久人妻精品一区三寸| 韩国毛片一区二区三区| 孩xxxx性bbbb欧美| 91成人精品一区二区| 亚洲高清一区二区三区| 欧美一区二区在线视频观看| 国产又粗又猛又爽又黄的| 亚洲精品国产拍免费91在线| 日本888xxxx| 成a人片亚洲日本久久| 国产精品高精视频免费| 久草免费在线观看视频| 欧美性色欧美a在线播放| 成人小视频在线观看免费| 日韩精品高清不卡| 欧美肥婆姓交大片| 国产精品久久免费观看| 午夜久久久久久久久| 亚洲最大免费| 日日噜噜夜夜狠狠视频欧美人 | 五月天综合在线| 欧美精品久久99久久在免费线| 东北少妇不带套对白| 极品美女销魂一区二区三区免费| 韩国日本不卡在线| 午夜三级在线观看| 在线亚洲一区观看| 日韩欧美不卡在线| 国产在线播放一区三区四| 人体精品一二三区| 国产在线视频二区| 91精品国产91久久综合桃花| 99草草国产熟女视频在线| 93久久精品日日躁夜夜躁欧美| 欧美日韩欧美一区二区| 久久久噜久噜久久综合| 调教驯服丰满美艳麻麻在线视频 | 国产亚洲精品久| 不卡日韩av| 亚洲一级黄色大片| 亚洲精品中文字| 国产大学生视频| 一区二区欧美国产| 中文字幕一区二区三区四区五区六区 | 国产一区二区三区精品在线| 黑人巨大精品欧美一区二区三区 | 欧美老肥婆性猛交视频| 成年人视频软件| 日本韩国欧美国产| 久久成人免费观看| 成人av午夜影院| 国产厕所精品在线观看| 99久久免费国产精精品| 裸体女人亚洲精品一区| 久久久久久久久久97| 6080午夜不卡| 91热视频在线观看| 亚洲人成网站精品片在线观看| 亚洲国产欧洲综合997久久| 日韩**一区毛片| 国产精品 欧美在线| 综合网在线观看| 亚洲免费视频一区二区| 成年人网站免费在线观看| 日韩欧美国产成人| 精品一卡二卡三卡| 欧美激情一区在线观看| 日韩美女一区| 精品一区免费av| 成人女保姆的销魂服务| 国产又粗又黄又爽的视频| 久久国产精品电影| 久久国产露脸精品国产| 亚洲高清不卡av| 久久精品一区二区免费播放| 在线一区二区三区四区五区| 日韩欧美国产片| 亚洲天堂av老司机| 亚洲乱码日产精品bd在线观看| 成人午夜激情视频| 精品国产一区二区三区四区精华 | 日本午夜一区二区| 国产精品久久久久久久久男| 中文字幕av片| 欧美成人第一页| 久久精品这里有| 亚洲人a成www在线影院| 色综合伊人色综合网| 99er在线视频| 91在线一区二区三区| 精品国产乱码久久久久软件| 丝袜诱惑制服诱惑色一区在线观看| 国产精品福利在线| 精品国产999久久久免费| 97精品在线视频| 欧美性猛交xxxx乱大交hd | 欧美日韩系列| 激情综合色播激情啊| av一本久道久久波多野结衣| 久久激情中文| 成人精品在线观看| 国模私拍视频在线| 国产精品久久久久久久久久新婚 | 亚洲精品中字| 国产成人在线视频网址| 欧美精品欧美精品| 精品在线亚洲视频| 国内精品**久久毛片app| 奇米色一区二区| www 成人av com| 免费在线一区观看| 国产精品高清一区二区三区| 日本亚洲天堂网| 成人免费观看网站| 麻豆精品在线播放| 国产精品国模大尺度私拍| 蜜臂av日日欢夜夜爽一区| 国产伦精品一区二区三区在线 | 国内精品在线播放| 久久99精品国产99久久| 国产一区二区不卡| 欧美伦理一区二区| 国产99久久久国产精品免费看 | 国产三级精品视频| 国产精品igao激情视频| 国产精品女人毛片| 日韩av一二三四区| 一区二区三区美女视频| 黄色在线视频网| 色综合视频一区二区三区高清| 亚洲三级在线视频| 欧美日韩国产小视频在线观看| 亚洲啪av永久无码精品放毛片| 日韩午夜激情电影| 中文字幕精品亚洲| 亚洲女人被黑人巨大进入al| 日韩一级片av| 日韩视频一区在线| 好吊色在线视频| 69久久夜色精品国产7777 | 精品女同一区二区三区在线播放| 天堂av8在线| 欧美视频在线一区二区三区 | 久久综合久久综合久久| 日韩欧美一级在线| 亚洲欧洲99久久| 日本熟妇人妻中出| 色94色欧美sute亚洲线路一ni| 国产 xxxx| 亚洲成人1234| 免费一级黄色大片| 欧美大成色www永久网站婷| 一级黄色片网站| 国产这里只有精品| 久久电影网电视剧免费观看| 欧美最大成人综合网| 久久亚洲捆绑美女| 免费观看美女裸体网站| 亚洲成人动漫av| 无码国产精品久久一区免费| 日韩欧美一区在线观看| 日韩女优一区二区| 欧美—级a级欧美特级ar全黄| 国产草草影院ccyycom| 91中文字精品一区二区| 成人综合在线视频|