色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

7B模型對標GPT-4o,全球首個醫療代碼生成大模型訓練平臺來了

醫療 AI的空白,MedAgentGym來填?

德克薩斯大學西南醫學中心團隊投稿

發自 凹非寺量子位 | 公眾號 QbitAI

醫療AI場景復雜,需要“又懂醫療又懂編程”的agent。

但像GPT這樣現成的大模型難以直接部署,該如何突破技術壁壘?

答案是:打造一個統一的訓練平臺,專門訓練能夠生成醫療代碼的大模型。

最近,來自埃默里大學、佐治亞理工學院、耶魯大學和德克薩斯大學西南醫學中心的研究團隊,發布了全球首個專注于醫療代碼生成的大模型訓練平臺——MedAgentGym。

7B模型對標GPT-4o,全球首個醫療代碼生成大模型訓練平臺來了

該平臺不僅提供了全面的評估基準,更重要的是建立了完整的訓練生態系統,能夠系統性提升大模型在醫療領域的代碼生成和推理能力。

實驗結果表明,經過MedAgentGym訓練的開源模型Med-Copilot-7B在多項醫療編程任務上達到了與GPT-4o相當的性能水平。

醫療AI的”編程瓶頸”

當前醫療AI應用面臨著一個關鍵技術挑戰:如何讓AI系統自動生成可靠的醫療相關代碼。

無論是處理電子健康記錄(EHR)查詢、生物信息學分析,還是構建臨床決策支持系統,都需要精確的編程能力作為支撐。

然而,現有解決方案存在明顯局限:

商業模型的現實困境

- 數據隱私風險:醫療數據的敏感性使得直接調用商業API存在合規風險
- 成本壓力:大規模醫療應用的API調用費用難以承受
- 部署限制:無法在本地或私有云環境中靈活部署

開源模型的能力短板

- 專業知識不足:缺乏深度的醫學領域知識
- 編程能力有限:在復雜的醫療編程任務上表現不佳
- 訓練資源缺乏:缺少專門的醫療代碼訓練數據和環境

研究表明,引入編程能力可以顯著提升模型在計算醫療推理任務上的表現。在MIMIC-III、eICU和MedCalcBench等數據集中,基于代碼的計算推理成功率遠高于傳統的自然語言推理方法。

7B模型對標GPT-4o,全球首個醫療代碼生成大模型訓練平臺來了

在MIMIC-III、eICU和MedCalcBench三個數據集中,基于代碼的計算推理(橙色)成功率遠高于傳統的敘述式推理(藍色)。

MedAgentGym:突破性的解決方案

7B模型對標GPT-4o,全球首個醫療代碼生成大模型訓練平臺來了

與其他基準相比,MedAgentGym提供了集成了可執行環境、交互式反饋和任務隔離運行設施的編碼訓練平臺。為了解決這一系列挑戰,MedAgentGym提供了一個前所未有的綜合性解決方案。該平臺的核心創新體現在三個維度:

大規模真實醫療任務集合

MedAgentGym整合了來自12個真實生物醫學場景的72,413個編程任務實例,覆蓋129個不同類別。

任務范圍橫跨四大核心領域:
- 結構化醫療信息檢索:如EHR數據庫查詢、臨床記錄分析- 醫療數據科學:包括統計分析、臨床計算等- 生物信息學建模:涵蓋序列分析、系統發育學等- 機器學習應用:臨床預測、風險評估等

數據模態極其豐富,包含臨床筆記、實驗室報告、EHR表格、生物序列等多種格式,全面考驗模型的綜合處理能力。

7B模型對標GPT-4o,全球首個醫療代碼生成大模型訓練平臺來了

高效可擴展的訓練基礎設施

MedAgentGym在技術架構上實現了多項突破:

- 容器化隔離環境:每個任務都封裝在獨立的Docker容器中,預裝所有依賴項,確保環境安全性和可復現性
- 交互式反饋機制:當代碼執行出錯時,系統能將錯誤信息轉化為結構化的自然語言反饋,幫助模型進行調試和優化
- 并行處理能力:集成Ray和Joblib等后端引擎,支持大規模并行軌跡采樣和訓練

7B模型對標GPT-4o,全球首個醫療代碼生成大模型訓練平臺來了

在擁有交互式調試能力時(藍色),gpt-4.1-mini模型的性能遠高于移除該能力后(橙色)的表現,證明了MedAgentGym交互式環境的巨大價值。

此外,錯誤類型分析揭示了當前模型在復雜醫療代碼任務中面臨的主要挑戰。其中,“陷入循環”不能成功debug是最主要的錯誤類型,占比高達50.39%。

全面的模型評估體系

研究團隊系統性評估了超過25個主流大模型,包括:

  • API商業模型:GPT系列
  • 開源通用模型:Qwen、LLaMA、Gemma等
  • 專業編程模型:Qwen2.5-Coder等
  • 醫療領域模型:HuatuoGPT、MedReason等

評估結果揭示了商業模型與開源模型之間的顯著性能差距,為后續優化指明了方向。

7B模型對標GPT-4o,全球首個醫療代碼生成大模型訓練平臺來了

MedAgentGym零樣本(Zero-shot)測試集結果詳細列出了超過25個前沿大模型在8個不同任務上的原始得分,是評估各模型在醫療代碼生成領域綜合實力的核心依據。

Med-Copilot:開源模型的逆襲之路

基于MedAgentGym平臺,研究團隊開發了Med-Copilot系列模型,并取得了突破性成果。

訓練策略: 采用兩階段精細化訓練框架:

- 監督微調(SFT):使用2,137個成功執行的代碼軌跡進行初始訓練
- 強化學習優化(DPO):通過偏好優化進一步提升性能

性能突破

Med-Copilot-7B通過SFT訓練,性能提升36.44%
結合DPO后,總體性能提升達到42.47%
最終在MedAgentGym基準上達到59.90分,接近GPT-4o的性能水平

關鍵技術創新

研究團隊還訓練了一個AI驗證器(Verifier),能夠從多次代碼生成嘗試中自動識別最佳解決方案。實驗顯示:

  • 在16次嘗試中,模型的潛在成功率可達45%
  • AI驗證器能夠以42%的準確率識別出正確答案
  • 僅有3%的差距證明了驗證器的可靠性
7B模型對標GPT-4o,全球首個醫療代碼生成大模型訓練平臺來了

僅使用SFT、僅使用DPO以及SFT與DPO結合的策略對7B和14B基礎模型性能的提升效果,驗證了SFT+DPO兩階段訓練框架的有效性。

可持續進化的藍圖:自我提升與性能擴展

MedAgentGym不僅展示了一次性的成功,更揭示了一條可持續進化的清晰路徑。其中的關鍵,在于一個強大的“AI裁判”(即驗證器,Verifier)。

性能具備高度可擴展性

研究團隊讓模型對同一個任務進行多次嘗試(最多16次),并讓“AI裁判”從這些嘗試中選出最佳答案。結果令人驚喜:

- 潛力上限 (Pass@k):在16次嘗試中,模型只要有一次成功,就算解出。在這種理想情況下,成功率從單次嘗試的17%飆升至45%。這說明模型本身具備解決問題的潛力。
- 實際表現 (Best@k):更關鍵的是,在“AI裁判”的幫助下,從這16次嘗試中自動選出的最佳答案,其實際成功率高達42%!

僅有3%的微小差距證明,這個AI裁判的眼光極其“毒辣”,能夠非常可靠地識別出正確的解決方案。這一成果意義重大,因為它意味著這個驗證器已經足夠強大,可以作為獎勵模型(Reward Model)賦能給PPO、GRPO等更先進的在線強化學習框架,為訓練出更強大的醫療AI鋪平了道路。

- 無論是增加訓練數據量,還是在推理時增加嘗試次數(Rollouts),模型的最終成功率都表現出穩定、顯著的提升。這為未來進一步提升模型性能指明了方向:更多的計算投入和數據積累,將帶來更強大的醫療AI智能體。

7B模型對標GPT-4o,全球首個醫療代碼生成大模型訓練平臺來了

推理時增加嘗試次數(k)能提升成功率(Pass@k);此外,顯示增加訓練數據量也能穩定提升模型表現。

- 模型可以自我提升:這種強大的驗證能力也解鎖了模型的自我提升:AI智能體可以通過“拒絕采樣+迭代DPO”的自我改進循環,利用自己生成的軌跡數據進行持續學習和優化,不斷突破性能上限 (3-5%)。

7B模型對標GPT-4o,全球首個醫療代碼生成大模型訓練平臺來了

通過“拒絕采樣SFT”和兩輪DPO的自我改進循環,模型性能得以持續增長。

未來展望:加速醫療AI的普惠化進程

MedAgentGym的發布,為醫學的AI和大語言模型智能體的研究者和開發者提供了一個強大工具。它通過提供一個統一、開放、可擴展的平臺,填補了醫療代碼智能體開發領域的關鍵空白。

通過將真實世界的生物醫學任務、高效可復現的基礎設施以及對前沿模型的大規模基準測試相結合,MedAgentGym為推動LLM在醫療領域的應用奠定了一個堅實的基礎。

研究團隊希望,MedAgentGym能夠激發更多創新,促進高效、可靠、臨床接地的AI智能體的發展,最終為現實世界的醫療研究與實踐提供支持。

有理由相信,在MedAgentGym的助力下,一個能夠從成功中學習、從失敗中進化的,更加智能和高效的未來醫療新時代,正加速到來。

論文鏈接:https://arxiv.org/abs/2506.04405

項目主頁:https://wshi83.github.io/MedAgentGym-Page/

代碼鏈接:https://github.com/wshi83/MedAgentGym

數據及模型:https://huggingface.co/MedAgentGym

— 完 —

量子位 QbitAI · 頭條號簽約

關注我們,第一時間獲知前沿科技動態

版權所有,未經授權不得以任何形式轉載及使用,違者必究。
欧美一级欧美一级在线播放| 亚洲国产小视频| 欧美成人合集magnet| 最新国产精品久久| 日韩亚洲欧美中文字幕| 国产宾馆实践打屁股91| 日韩精品一区二区在线观看| 国产aⅴ精品一区二区三区黄| 中国xxxx性xxxx产国| 日日夜夜精品视频天天综合网| 欧美日韩国产精品一区二区三区四区| 欧美亚州一区二区三区| 99日在线视频| 性高潮久久久久久久久久| 欧美区一区二区三区| 国产精品18毛片一区二区| 一区二区黄色片| 丰满白嫩尤物一区二区| 深夜福利国产精品| 国内外成人激情视频| 中文字幕一区二区三区四区免费看 | 青青草国产成人99久久| 日韩精品一区二区三区老鸭窝| 色一情一乱一伦一区二区三区 | 91精品国产自产| 国产91精品在线观看| 最新日韩中文字幕| 天堂在线资源视频| 日韩电影在线观看网站| 国产视频精品va久久久久久 | 亚洲午夜精品福利| 欧美日韩一二三四区| 岛国av在线不卡| 精品国产综合区久久久久久| 懂色av懂色av粉嫩av| 亚洲女人****多毛耸耸8| 国产精自产拍久久久久久蜜| 国产在线综合视频| 国产精品国产自产拍在线| 国产精品久久久久久久久久新婚| 尤物视频最新网址| 亚洲少妇30p| 91丝袜美腿美女视频网站| 999精品视频在线观看播放| 成人欧美一区二区三区视频网页| 国产欧美va欧美va香蕉在| 欧美老女人性生活视频| 亚洲精品中文在线影院| 久久久水蜜桃| 91国内精品久久久| 亚洲国产精品字幕| www.久久久精品| 国产成人精品影视| 日韩免费av片在线观看| 99成人在线观看| 精品国产成人在线| 亚洲区一区二区三区| 精品人妻伦一区二区三区久久 | 亚洲香蕉成视频在线观看| 天堂中文视频在线| 99视频热这里只有精品免费| 国产日韩中文字幕| 无码人妻精品一区二| 欧美一区二区网站| av免费网站观看| 91香蕉视频污在线| 91久久久久久国产精品| 免费看一级视频| 亚洲国产成人精品久久久国产成人一区| 日本黄色三级大片| xfplay精品久久| 国产日韩欧美精品| 国产精品一区二区免费视频| 亚洲午夜av电影| 国产不卡一二三| 亚洲国产va精品久久久不卡综合 | 国产一区二区三区无遮挡| 中文字幕乱码人妻二区三区| 亚洲色图美腿丝袜| 亚洲一区视频在线播放| 色综合一区二区三区| 又大又硬又爽免费视频| 国产黑丝在线一区二区三区| 国产日韩精品视频| 国产精品欧美久久久久天天影视 | 亚洲人成网站免费播放| 无码国产精品一区二区免费式直播| 日韩久久一区二区| 伊人久久av导航| 国产自产高清不卡| 97av自拍| 天天摸天天碰天天爽天天弄| 日本精品视频在线| www.色国产| 深夜福利日韩在线看| 日本在线一级片| 日韩精品在线私人| 山东少妇露脸刺激对白在线| 日韩一区二区在线看| 制服丝袜av在线| 在线视频观看一区| 中文字幕欧美视频| 在线看国产一区二区| 伊人国产精品视频| 精品国产精品自拍| 欧美一级xxxx| 日韩人体视频一二区| 亚欧在线免费观看| 欧美日韩国产黄| www.污污视频| 欧美色综合网站| 一级黄色片毛片| 欧美三级在线看| 精品视频站长推荐| 这里只有精品电影| 日本丰满少妇裸体自慰| 欧美一三区三区四区免费在线看| 日本japanese极品少妇| 91 com成人网| 亚洲精品国产91| 亚洲免费人成在线视频观看| 欧美日韩激情在线观看| 久久天天躁狠狠躁夜夜躁| 国产 日韩 欧美 在线| 欧美成人一区二区三区电影| 在线观看国产精品入口男同| 国产不卡在线观看| 久久国产日韩| 精品国产第一页| 99久久精品费精品国产一区二区| 最新av网址在线观看| 国产精品女人毛片| 色多多视频在线播放| 色婷婷久久一区二区三区麻豆| 久久发布国产伦子伦精品| 欧美丰满美乳xxx高潮www| 亚洲无人区码一码二码三码的含义| 精品国产一区二区三区四区四 | 国产精品国产三级欧美二区| 国产麻豆精品久久一二三| 亚洲国产成人不卡| 最近日韩中文字幕| 色婷婷一区二区三区在线观看| 日韩一区二区电影网| 四虎免费在线视频| 97在线精品国自产拍中文| 久久久精品性| 一区二区视频在线免费| 亚洲电影一区二区三区| 国产精品扒开腿做爽爽| 久久九九全国免费精品观看| 国产色视频在线| 精品无人乱码一区二区三区的优势| 91在线观看下载| 色悠悠久久综合网| 日韩美女主播在线视频一区二区三区| 538精品在线观看| 热久久免费国产视频| 国产精品一区二区你懂的| 99热久久这里只有精品| 在线视频一区二区三区| 久久久久久久久精| 国产精品美女久久| www.欧美色图| 亚洲黄色av片| 夜夜嗨av一区二区三区免费区| 国产乱码一区二区| 日本高清不卡一区二区三| 亚洲美女视频在线观看| 亚洲av片不卡无码久久| 欧美精品videofree1080p| 久久狠狠亚洲综合| 女人另类性混交zo| 日韩av在线不卡| www.麻豆av| 一区二区三区在线观看www| 色婷婷av一区二区三区软件| 免费一级a毛片夜夜看| 91久久精品在线| 中文字幕乱码一区二区免费| 无遮挡aaaaa大片免费看| 久久久人成影片一区二区三区| 国产一区二区不卡| 色噜噜狠狠一区二区三区狼国成人| 亚洲人高潮女人毛茸茸| 日韩影院精彩在线| 18岁视频在线观看| 中文字幕亚洲综合| 麻豆成人免费电影| 成人综合久久网| 免费99精品国产自在在线| 久久爱www久久做| 成年人视频网站免费观看| 亚洲国产精品久久久久秋霞蜜臀| 亚洲xxxx天美| 国产成人精品视频免费看| 日韩成人免费视频| 可以免费看不卡的av网站| 农村妇女精品一二区| 一区二区三区国产视频| 紧缚捆绑精品一区二区| 美女日批在线观看| 欧美亚洲免费电影| 国产精品乱人伦| 日韩a级片在线观看| 精品不卡一区二区三区| 欧美日韩国产综合一区二区三区| 91theporn国产在线观看| 青青视频免费在线观看| 亚洲男人天堂古典| 国产精品77777竹菊影视小说| 亚洲麻豆一区二区三区| 国产日韩在线一区| 色综合久久88色综合天天 | 欧美在线视频观看免费网站| 国产精品无遮挡| 国产乡下妇女做爰毛片| 中文字幕一区二区三区乱码 | 中文字幕在线视频第一页| 国产精品一色哟哟| 久久精品国产欧美亚洲人人爽| 91污在线观看| www.av视频在线观看| 免费在线精品视频| 中文字幕国产亚洲| 久久综合九色综合欧美98| 精品自拍偷拍视频| 一区二区免费电影| 国产亚洲精品久久久久动| 成人蜜臀av电影| 永久久久久久久| 日韩精品一区二区三区电影| 日韩有码在线观看| 国产精品久久久久久福利一牛影视 | 午夜精品视频一区| 国产片高清在线观看| 亚洲一级免费观看| 国产精品一区av| 欧美久久一二区| 激情综合色播激情啊| 亚洲一级理论片| 亚洲欧美影院| 欧美黑人性生活视频| 综合久久久久久| 国产成人三级在线播放| 丰满少妇一区二区三区专区| av在线不卡一区| 精品一区电影国产| 中文字幕在线观看不卡视频| 在线免费看91| 日韩av成人网| 精品国产一二| 日韩在线小视频| 亚洲午夜在线电影| 日韩国产精品久久| 91免费公开视频| 日本人体一区二区| 国产精品成人免费视频| 日韩欧美第一区| 99r精品视频| 中文字幕一区二区在线视频 | 天堂蜜桃91精品| 天堂网av2018| 欧美日韩黄色一级片| 日本午夜在线亚洲.国产| 欧美日本乱大交xxxxx| 成人精品gif动图一区| 夜夜爽妓女8888视频免费观看| xxxx在线免费观看| 精品在线视频一区二区| 欧美成aaa人片免费看| 在线观看一区二区精品视频| 丁香婷婷综合色啪| 91在线公开视频| 少妇人妻好深好紧精品无码| 国产va亚洲va在线va| 成人午夜一级二级三级| 中文字幕亚洲自拍| 欧美在线视频全部完| 久久奇米777| 日本xxxxwww| 久久综合色综合| 四川一级毛毛片| 日韩福利视频| 国产福利成人在线| 亚洲人成免费电影| 欧美亚洲禁片免费| 亚洲国产成人在线| 蜜臂av日日欢夜夜爽一区| 国产精彩视频在线观看| 丰满人妻一区二区三区53视频| 亚洲精品自在在线观看| 国产精品久久久久久av下载红粉 | 天堂av中文字幕| 北条麻妃99精品青青久久| 国产在线视频欧美| 男人添女人下面高潮视频| 99久久精品日本一区二区免费| 久久国产麻豆精品| 色香蕉在线视频| 91精品国产综合久久香蕉麻豆| 久久国产精品久久| 成人黄色激情视频| 色香蕉成人二区免费| 精品麻豆av| 日韩欧美大片在线观看| 成人在线视频一区二区| 亚洲一区二区三区四区五区黄| 久久精品国产亚洲7777| 国产最新免费视频| 日韩电影在线免费观看| 欧美久久久久久久久| 97在线日本国产| 精品无码一区二区三区爱欲| 精品一区在线视频| 亚洲精品一区二区网址| 秋霞久久久久久一区二区| 性生交生活影碟片| 久久久久久久久久久久av| 无码aⅴ精品一区二区三区浪潮| 日本激情一区二区| 欧美美最猛性xxxxxx| 国产在线观看h| 国产哺乳奶水91在线播放| 综合激情成人伊人| 色爱区成人综合网| 一二三四区在线| 一个色综合导航| 欧美精品入口蜜桃| 668精品在线视频| 无码国产色欲xxxx视频| 国产精品美女久久| 蜜桃久久一区二区三区| 国产福利精品视频| 午夜爽爽爽男女免费观看| 欧美色综合网站| 国产综合欧美在线看| www.国产麻豆| 日韩在线视频免费观看高清中文| 日本不卡一区二区在线观看| 亚洲国产电影在线观看| 热99精品里视频精品| 国产黄色网址在线观看| 中文字幕+乱码+中文字幕一区| 欧美最近摘花xxxx摘花| 免费精品视频在线| 精品免费二区三区三区高中清不卡| 国产精品久久免费| 久久综合五月天| 一级做a爰片毛片| 亚洲电影av在线| 免费 成 人 黄 色| 国产又大又粗又爽| 欧美大奶子在线| 男人天堂视频在线| 中文字幕日韩欧美| 免费精品视频在线| 男同互操gay射视频在线看| 欧美三级视频在线播放| 国产情侣自拍av| 99热在线国产| 国产清纯在线一区二区www| 亚洲精品无码久久久久久| 一卡二卡欧美日韩| 久久视频这里有精品| 国产亚洲综合av| 欧美 日韩精品| 亚洲一区在线播放| 香港三级韩国三级日本三级| 91豆麻精品91久久久久久| 丁香婷婷激情网| 久久综合成人精品亚洲另类欧美| 国产精品色婷婷视频| 日韩精品一区二区av| 亚洲qvod图片区电影| 亚洲永久免费av| 国产调教打屁股xxxx网站| 亚洲一区二区在线视频| wwwxx日本| 神马久久久久久| 在线观看国产精品入口男同| 日韩欧美在线一区二区三区| 五月天中文字幕在线| 欧美精品一区二区三区久久久| 天堂资源在线播放| 99久久自偷自偷国产精品不卡| 欧美性猛交xxxx偷拍洗澡| 丰满少妇xoxoxo视频| 欧美久久久久久久久久久久久| 精品少妇v888av| 国产欧美一区二区精品性色 | 亚洲少妇激情视频| 九九九视频在线观看| 欧美日韩高清区| 亚洲精品毛片一区二区三区| 91嫩草免费看| 中文字幕+乱码+中文字幕一区| 国产精品视频中文字幕| 欧美一区二区视频网站| 国产精品777777| 免费观看国产成人| 99r精品视频| 日韩一级性生活片| 欧美影视一区在线| 久久久久黄色片| 欧美影院在线播放| 极品少妇xxxx精品少妇| 日韩一级片播放| 亚洲欧美激情精品一区二区| 日韩精品亚洲一区|