色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

7B模型對標GPT-4o,全球首個醫療代碼生成大模型訓練平臺來了

醫療 AI的空白,MedAgentGym來填?

德克薩斯大學西南醫學中心團隊投稿

發自 凹非寺量子位 | 公眾號 QbitAI

醫療AI場景復雜,需要“又懂醫療又懂編程”的agent。

但像GPT這樣現成的大模型難以直接部署,該如何突破技術壁壘?

答案是:打造一個統一的訓練平臺,專門訓練能夠生成醫療代碼的大模型。

最近,來自埃默里大學、佐治亞理工學院、耶魯大學和德克薩斯大學西南醫學中心的研究團隊,發布了全球首個專注于醫療代碼生成的大模型訓練平臺——MedAgentGym。

7B模型對標GPT-4o,全球首個醫療代碼生成大模型訓練平臺來了

該平臺不僅提供了全面的評估基準,更重要的是建立了完整的訓練生態系統,能夠系統性提升大模型在醫療領域的代碼生成和推理能力。

實驗結果表明,經過MedAgentGym訓練的開源模型Med-Copilot-7B在多項醫療編程任務上達到了與GPT-4o相當的性能水平。

醫療AI的”編程瓶頸”

當前醫療AI應用面臨著一個關鍵技術挑戰:如何讓AI系統自動生成可靠的醫療相關代碼。

無論是處理電子健康記錄(EHR)查詢、生物信息學分析,還是構建臨床決策支持系統,都需要精確的編程能力作為支撐。

然而,現有解決方案存在明顯局限:

商業模型的現實困境

- 數據隱私風險:醫療數據的敏感性使得直接調用商業API存在合規風險
- 成本壓力:大規模醫療應用的API調用費用難以承受
- 部署限制:無法在本地或私有云環境中靈活部署

開源模型的能力短板

- 專業知識不足:缺乏深度的醫學領域知識
- 編程能力有限:在復雜的醫療編程任務上表現不佳
- 訓練資源缺乏:缺少專門的醫療代碼訓練數據和環境

研究表明,引入編程能力可以顯著提升模型在計算醫療推理任務上的表現。在MIMIC-III、eICU和MedCalcBench等數據集中,基于代碼的計算推理成功率遠高于傳統的自然語言推理方法。

7B模型對標GPT-4o,全球首個醫療代碼生成大模型訓練平臺來了

在MIMIC-III、eICU和MedCalcBench三個數據集中,基于代碼的計算推理(橙色)成功率遠高于傳統的敘述式推理(藍色)。

MedAgentGym:突破性的解決方案

7B模型對標GPT-4o,全球首個醫療代碼生成大模型訓練平臺來了

與其他基準相比,MedAgentGym提供了集成了可執行環境、交互式反饋和任務隔離運行設施的編碼訓練平臺。為了解決這一系列挑戰,MedAgentGym提供了一個前所未有的綜合性解決方案。該平臺的核心創新體現在三個維度:

大規模真實醫療任務集合

MedAgentGym整合了來自12個真實生物醫學場景的72,413個編程任務實例,覆蓋129個不同類別。

任務范圍橫跨四大核心領域:
- 結構化醫療信息檢索:如EHR數據庫查詢、臨床記錄分析- 醫療數據科學:包括統計分析、臨床計算等- 生物信息學建模:涵蓋序列分析、系統發育學等- 機器學習應用:臨床預測、風險評估等

數據模態極其豐富,包含臨床筆記、實驗室報告、EHR表格、生物序列等多種格式,全面考驗模型的綜合處理能力。

7B模型對標GPT-4o,全球首個醫療代碼生成大模型訓練平臺來了

高效可擴展的訓練基礎設施

MedAgentGym在技術架構上實現了多項突破:

- 容器化隔離環境:每個任務都封裝在獨立的Docker容器中,預裝所有依賴項,確保環境安全性和可復現性
- 交互式反饋機制:當代碼執行出錯時,系統能將錯誤信息轉化為結構化的自然語言反饋,幫助模型進行調試和優化
- 并行處理能力:集成Ray和Joblib等后端引擎,支持大規模并行軌跡采樣和訓練

7B模型對標GPT-4o,全球首個醫療代碼生成大模型訓練平臺來了

在擁有交互式調試能力時(藍色),gpt-4.1-mini模型的性能遠高于移除該能力后(橙色)的表現,證明了MedAgentGym交互式環境的巨大價值。

此外,錯誤類型分析揭示了當前模型在復雜醫療代碼任務中面臨的主要挑戰。其中,“陷入循環”不能成功debug是最主要的錯誤類型,占比高達50.39%。

全面的模型評估體系

研究團隊系統性評估了超過25個主流大模型,包括:

  • API商業模型:GPT系列
  • 開源通用模型:Qwen、LLaMA、Gemma等
  • 專業編程模型:Qwen2.5-Coder等
  • 醫療領域模型:HuatuoGPT、MedReason等

評估結果揭示了商業模型與開源模型之間的顯著性能差距,為后續優化指明了方向。

7B模型對標GPT-4o,全球首個醫療代碼生成大模型訓練平臺來了

MedAgentGym零樣本(Zero-shot)測試集結果詳細列出了超過25個前沿大模型在8個不同任務上的原始得分,是評估各模型在醫療代碼生成領域綜合實力的核心依據。

Med-Copilot:開源模型的逆襲之路

基于MedAgentGym平臺,研究團隊開發了Med-Copilot系列模型,并取得了突破性成果。

訓練策略: 采用兩階段精細化訓練框架:

- 監督微調(SFT):使用2,137個成功執行的代碼軌跡進行初始訓練
- 強化學習優化(DPO):通過偏好優化進一步提升性能

性能突破

Med-Copilot-7B通過SFT訓練,性能提升36.44%
結合DPO后,總體性能提升達到42.47%
最終在MedAgentGym基準上達到59.90分,接近GPT-4o的性能水平

關鍵技術創新

研究團隊還訓練了一個AI驗證器(Verifier),能夠從多次代碼生成嘗試中自動識別最佳解決方案。實驗顯示:

  • 在16次嘗試中,模型的潛在成功率可達45%
  • AI驗證器能夠以42%的準確率識別出正確答案
  • 僅有3%的差距證明了驗證器的可靠性
7B模型對標GPT-4o,全球首個醫療代碼生成大模型訓練平臺來了

僅使用SFT、僅使用DPO以及SFT與DPO結合的策略對7B和14B基礎模型性能的提升效果,驗證了SFT+DPO兩階段訓練框架的有效性。

可持續進化的藍圖:自我提升與性能擴展

MedAgentGym不僅展示了一次性的成功,更揭示了一條可持續進化的清晰路徑。其中的關鍵,在于一個強大的“AI裁判”(即驗證器,Verifier)。

性能具備高度可擴展性

研究團隊讓模型對同一個任務進行多次嘗試(最多16次),并讓“AI裁判”從這些嘗試中選出最佳答案。結果令人驚喜:

- 潛力上限 (Pass@k):在16次嘗試中,模型只要有一次成功,就算解出。在這種理想情況下,成功率從單次嘗試的17%飆升至45%。這說明模型本身具備解決問題的潛力。
- 實際表現 (Best@k):更關鍵的是,在“AI裁判”的幫助下,從這16次嘗試中自動選出的最佳答案,其實際成功率高達42%!

僅有3%的微小差距證明,這個AI裁判的眼光極其“毒辣”,能夠非??煽康刈R別出正確的解決方案。這一成果意義重大,因為它意味著這個驗證器已經足夠強大,可以作為獎勵模型(Reward Model)賦能給PPO、GRPO等更先進的在線強化學習框架,為訓練出更強大的醫療AI鋪平了道路。

- 無論是增加訓練數據量,還是在推理時增加嘗試次數(Rollouts),模型的最終成功率都表現出穩定、顯著的提升。這為未來進一步提升模型性能指明了方向:更多的計算投入和數據積累,將帶來更強大的醫療AI智能體。

7B模型對標GPT-4o,全球首個醫療代碼生成大模型訓練平臺來了

推理時增加嘗試次數(k)能提升成功率(Pass@k);此外,顯示增加訓練數據量也能穩定提升模型表現。

- 模型可以自我提升:這種強大的驗證能力也解鎖了模型的自我提升:AI智能體可以通過“拒絕采樣+迭代DPO”的自我改進循環,利用自己生成的軌跡數據進行持續學習和優化,不斷突破性能上限 (3-5%)。

7B模型對標GPT-4o,全球首個醫療代碼生成大模型訓練平臺來了

通過“拒絕采樣SFT”和兩輪DPO的自我改進循環,模型性能得以持續增長。

未來展望:加速醫療AI的普惠化進程

MedAgentGym的發布,為醫學的AI和大語言模型智能體的研究者和開發者提供了一個強大工具。它通過提供一個統一、開放、可擴展的平臺,填補了醫療代碼智能體開發領域的關鍵空白。

通過將真實世界的生物醫學任務、高效可復現的基礎設施以及對前沿模型的大規模基準測試相結合,MedAgentGym為推動LLM在醫療領域的應用奠定了一個堅實的基礎。

研究團隊希望,MedAgentGym能夠激發更多創新,促進高效、可靠、臨床接地的AI智能體的發展,最終為現實世界的醫療研究與實踐提供支持。

有理由相信,在MedAgentGym的助力下,一個能夠從成功中學習、從失敗中進化的,更加智能和高效的未來醫療新時代,正加速到來。

論文鏈接:https://arxiv.org/abs/2506.04405

項目主頁:https://wshi83.github.io/MedAgentGym-Page/

代碼鏈接:https://github.com/wshi83/MedAgentGym

數據及模型:https://huggingface.co/MedAgentGym

— 完 —

量子位 QbitAI · 頭條號簽約

關注我們,第一時間獲知前沿科技動態

版權所有,未經授權不得以任何形式轉載及使用,違者必究。
亚洲一区二区在线免费看| 日韩综合第一页| 美女久久久精品| 国产欧美日韩精品丝袜高跟鞋| 久久久久99精品成人片三人毛片| 日韩精品在线影院| 国产福利精品在线| www亚洲色图| 国产99久久久国产精品潘金| 九九热这里只有精品6| 日韩欧美在线免费观看视频| 亚洲私人影院在线观看| 人人妻人人澡人人爽欧美一区 | 美女福利视频一区| 亚洲综合一二三| 在线视频欧美日韩精品| 久在线观看视频| 亚洲女厕所小便bbb| 最近中文字幕日韩精品| 久久久久久久久久99| 久久精品影视伊人网| 免费在线不卡av| 国产成人精品最新| 香蕉视频网站在线| 国产精品天天狠天天看 | 欧美精品做受xxx性少妇| 中文字幕日本视频| 国产精自产拍久久久久久蜜 | 999热视频| 国产suv一区二区三区88区| mm131午夜| 岛国视频午夜一区免费在线观看| 久久在线中文字幕| 欧美性猛交xxxx免费看| 丁香花五月婷婷| 亚洲男人第一网站| 久久久久久久久久久久久久久久久 | 91精品网站| 99久久精品国产导航| 18岁视频在线观看| 欧美国产欧美亚州国产日韩mv天天看完整| 九九热久久66| 亚洲青青青在线视频| 精品人妻无码一区二区三区换脸| 日韩电影大片中文字幕| 欧美亚洲另类小说| 久久伊人资源站| 日韩av一区二| 亚洲成人午夜在线| 欧美性猛交xxxx免费看| 精品爆乳一区二区三区无码av| 欧美日韩国产综合久久 | 中文字幕电影一区| 国产毛片毛片毛片毛片毛片毛片| 亚洲成人动漫在线观看| 成年人看片网站| 久久中文字幕一区| 国产一区二区三区在线观看精品| 国产二区视频在线播放| 日韩精品免费在线视频观看| 91午夜精品亚洲一区二区三区| 久久久一本精品99久久精品| 久久久久国产精品麻豆| 亚洲国产天堂av| 青青a在线精品免费观看| 久久综合九色综合97_久久久| 国模私拍视频在线观看| 午夜电影一区二区三区| 五月婷婷色丁香| 久久国产精品高清| 色激情天天射综合网| www.男人天堂| 成人免费在线网址| 精品福利一区二区| 亚洲人做受高潮| 精品国产免费人成电影在线观...| 美女任你摸久久 | 欧美在线一区二区| 岳乳丰满一区二区三区| 精品久久一二三| 精品国产一区久久久| 国产性生活视频| jizzjizz国产精品喷水| 一区二区在线视频| 国产成人精品在线看| 国产精品美女高潮无套| 老司机精品福利在线观看| 欧美区一区二区三区| 蜜乳av一区二区| 中文字幕在线1| 亚洲日本精品一区| 久久综合88中文色鬼| 亚洲欧洲精品一区二区三区不卡| 一级片免费在线播放| 国产免费又粗又猛又爽| 成人有码在线播放| 欧美丝袜丝交足nylons| 人妻妺妺窝人体色www聚色窝| 国产96在线 | 亚洲| 中文字幕亚洲精品| 亚洲欧美综合另类在线卡通| 久久精品黄色片| 欧美精品99久久| 久久久视频在线| 日韩精品成人一区二区在线| 一道本在线观看| 色综合电影网| 欧美极品xxxx| 欧美性xxxx| 懂色av中文一区二区三区 | 欧美日韩一区二区三区电影| 欧美国产视频一区二区| 91在线精品一区二区| 欧美成人国产精品高潮| 久久久久久久久久久视频| 91精品久久久久久久久青青| 亚洲第一二三四五区| 自拍av一区二区三区| 波多野结衣在线电影| 欧美日韩一级大片| 91久久在线视频| 精品视频在线播放| 久久精品一区八戒影视| 免费观看黄一级视频| 精品丰满少妇一区二区三区| 男人j进女人j| 日本人成精品视频在线| 欧美精彩视频一区二区三区| 日本欧美www| 欧美三级黄色大片| 97超碰青青草| 亚洲午夜激情| 国产精品视频入口| 色综合视频一区中文字幕| 欧美日韩国产精品一区二区不卡中文| 国产1区2区3区精品美女| 国产成年人免费视频| 91传媒免费视频| 欧美一区二区三区在线播放| 国产日产亚洲精品| 日韩中文字幕国产精品| 亚洲国产欧美另类丝袜| 久久久久久久综合狠狠综合| 久久精品免费看| 亚州av在线播放| 国产一区二区三区四区视频| 麻豆亚洲av熟女国产一区二 | 少妇高潮久久久| ,亚洲人成毛片在线播放| 日本少妇毛茸茸高潮| 中国毛片直接看| 3d动漫精品啪啪一区二区下载| 永久av免费在线观看| 日韩avxxx| 野外做受又硬又粗又大视频√| 日韩三级在线播放| 亚洲精品美女久久7777777| 日韩高清dvd| 日本精品国语自产拍在线观看| 97自拍视频| 国产精品免费看一区二区三区| 99在线观看视频| 国产伦精品一区二区三区视频孕妇| 91av在线国产| 国产一区二区视频在线观看| 国产精品亚洲激情| 91精品视频大全| 精品无码久久久久久久动漫| 亚洲欧洲在线一区| 黄色成人在线看| 国产wwwxx| 色男人天堂av| 91人人澡人人爽| 在线视频第一页| jizz国产免费| 国产精品嫩草影院精东| 奇米777欧美一区二区| 岛国精品一区二区| 国产精品久久久久久久久快鸭 | 一起操在线视频| 成人h动漫精品一区| 久久久久久久久久综合 | 亚洲最大的成人av| 综合激情成人伊人| 精品久久久久久久久久久久久| 欧美日韩亚州综合| 色妞色视频一区二区三区四区| 97热精品视频官网| 999日本视频| 免费国产黄色网址| www.啪啪.com| 亚洲欧美自拍视频| 久久er99热精品一区二区| 中文字幕一区视频| 欧美日韩1234| 久久99精品视频一区97| 99精品99久久久久久宅男| 日本一二三区视频在线| 88av在线播放| 在线视频一区二区三区四区| 久久精品麻豆| 国产精品久久久久久久久搜平片 | 欧美日韩激情一区| 久久av资源网站| 国产精品伊人日日| xx欧美撒尿嘘撒尿xx| 青青草偷拍视频| 国产日韩免费视频| 国产精品黄色在线观看| 欧美一区二区三区啪啪| 国产午夜精品全部视频播放| 国产精品久久久久久久久久三级| 国产伦精品一区二区三区视频黑人 | 欧美日韩一区二区免费在线观看 | 国产视频精品免费播放| 91精品久久久久久久久| 黄www在线观看| 亚洲精品在线观看av| 久草精品在线观看| 日韩欧美一区二区三区| 久久久久久久久91| 国产精品videossex国产高清| 女性裸体视频网站| 国产精品一区二区在线播放| 欧美一级淫片007| 91亚洲精华国产精华| 成人午夜视频在线观看免费| 久久艹精品视频| 久久一区二区三区国产精品| 日韩精品免费在线| 欧美日韩精品中文字幕一区二区| 内射国产内射夫妻免费频道| 日本熟妇色xxxxx日本免费看| 国内精品国产三级国产a久久| 欧美日韩国产一二三| 欧美大片免费观看| 国产av天堂无码一区二区三区| www.com亚洲| 亚洲综合免费观看高清完整版在线| 精品小视频在线| 99在线视频首页| 久久久久国产免费| 天堂影院一区二区| 日韩欧美国产精品一区| 国产日韩精品在线| 成年人免费大片| 波多野结衣视频免费观看| 一区二区免费在线播放| 国产做受高潮69| 国产97在线 | 亚洲| 老熟妇一区二区三区| 亚洲国产视频直播| 国内精品久久久久影院 日本资源| www.四虎成人| 五月天婷婷在线播放| 日本韩国欧美一区二区三区| 国产成人精品福利一区二区三区| 老熟妇一区二区| 国产女人18毛片水真多成人如厕 | 久久精品一偷一偷国产| 五月天六月丁香| 成人av先锋影音| 久久99热精品| 中国一级特黄录像播放 | 成人在线观看毛片| 无码久久精品国产亚洲av影片| 一本到三区不卡视频| 亚洲jizzjizz日本少妇| 国产主播在线观看| 6080国产精品一区二区| 黄色录像特级片| 日韩国产精品大片| 欧美激情一区二区三区成人| 无码国产精品一区二区免费式直播 | 黑人巨大精品一区二区在线| 欧美在线免费观看亚洲| 久久国产精品亚洲va麻豆| 中文天堂在线资源| 欧美日韩国产在线播放网站| www婷婷av久久久影片| 久久久久综合| 国内精品免费午夜毛片| 九九热久久免费视频| 91精品办公室少妇高潮对白| koreanbj精品视频一区| 国产精品正在播放| 成人国产精品日本在线| 中文字幕一二区| 国产一区二区三区欧美| 国精产品一区一区三区免费视频| 怡红院av一区二区三区| 欧美视频在线第一页| 国产精品一区在线| 亚洲aa中文字幕| 亚洲中文字幕一区二区| 日韩在线精品视频| 日本老熟俱乐部h0930| 精品国产伦一区二区三区观看体验| 亚洲精品乱码久久久久久9色| 中文字幕在线观看不卡| 久久久99精品视频| 久久久99久久精品欧美| 亚洲一区影院| 91香蕉视频污| 日韩精品一区二区三区电影| 99国产精品国产精品毛片| 欧美性xxxx69| av男人天堂一区| 亚洲看片网站| 国产欧美一区二区在线| 免费在线看黄色片| 国产成人免费av在线| 欧日韩一区二区三区| 9人人澡人人爽人人精品| 日韩精品久久一区二区三区| 99久久综合色| 超级碰在线观看| 中文字幕制服丝袜一区二区三区| 欧美亚洲另类久久综合| 成人午夜又粗又硬又大| 中文字幕免费在线不卡| 日本一区二区三区四区在线视频| 少妇一晚三次一区二区三区| 久久久久久97三级| 日韩欧美一区三区| 欧美午夜激情小视频| 久久久久国产精品区片区无码| 日韩亚洲欧美高清| 欧美黄色一区二区三区| 欧美国产日本在线| 精品国产www| 国产另类自拍| 91丨九色丨蝌蚪丨老版| 欧美在线观看www| 欧美日韩一区在线观看| 欧美肥妇bbwbbw| 一区二区欧美日韩视频| 国产精品男女视频| 91精品视频观看| 99re这里都是精品| 污污视频网站在线| 欧美日韩一区二区三区免费看 | 亚洲一区二区三区无码久久| 日韩视频免费观看| 日本v片在线高清不卡在线观看| av动漫在线播放| 亚洲激情图片一区| 1024手机在线观看你懂的| 国内精久久久久久久久久人| 国产精品一区二区三区99| 国产激情在线观看视频| 亚洲免费小视频| 久久亚洲美女| 欧洲黄色一级视频| 日韩精品专区在线影院观看| 一级欧美一级日韩| 亚洲啪啪av| 777午夜精品免费视频| 久久艹精品视频| 国产精品白丝jk白祙| 图片区日韩欧美亚洲| 国产精品50页| 久久综合九色综合久99| 欧美特黄级在线| 一级特黄aa大片| 欧美少妇一区| 高跟丝袜一区二区三区| 欧美黑人精品一区二区不卡| 国产精品久久久久久久av电影 | 亚洲影院污污.| 色天天综合色天天久久| 久久久久亚洲视频| 日韩成人午夜影院| 一本色道久久88精品综合| 久久影院亚洲| 爱情岛论坛亚洲自拍| 热99精品里视频精品| 亚洲精品视频一区二区| 亚洲天堂一级片| 国产不卡一区二区三区在线观看| 懂色aⅴ精品一区二区三区蜜月| 欧美性猛交bbbbb精品| 日韩激情视频一区二区| 最新的欧美黄色| 国产日韩欧美制服另类| 精品成人av一区二区在线播放| 麻豆国产精品官网| 久久久久99精品成人片| 久久精品欧美视频| 99热在这里有精品免费| 中文字幕在线观看免费视频| av女优在线播放| 国产精品久久二区| 69久久夜色精品国产7777| 久久久久999| 国产亚洲在线播放| 亚洲视频在线视频| 蜜桃在线一区二区三区| 日韩精品一区二区亚洲av| 成人做爰视频网站| 女同激情久久av久久| 国产精品乱子乱xxxx| 久久综合色影院| 91精品福利视频| 97精品久久久午夜一区二区三区 | 欧美国产日韩xxxxx| 91麻豆精品国产91久久久资源速度 | 91小视频在线免费看| 无码人妻熟妇av又粗又大| 国产精品三级在线观看无码|