色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

微軟僅憑「提示工程」讓GPT-4成醫學專家!超過一眾高度微調模型,專業測試準確率首次超90%

網友:看來還未觸及極限

西風 發自 凹非寺

量子位 | 公眾號 QbitAI

微軟最新研究再次證明提示工程的威力——

無需額外微調,無需專家策劃,僅憑提示,GPT-4就能化身“專家”。

微軟僅憑「提示工程」讓GPT-4成醫學專家!超過一眾高度微調模型,專業測試準確率首次超90%

使用他們提出的最新提示策略Medprompt,在醫療專業領域,GPT-4在MultiMed QA九個測試集中取得最優結果。

在MedQA數據集(美國醫師執照考試題)上,Medprompt讓GPT-4的準確率首次超過90%,超越BioGPT和Med-PaLM等一眾微調方法。

微軟僅憑「提示工程」讓GPT-4成醫學專家!超過一眾高度微調模型,專業測試準確率首次超90%

研究人員還表示Medprompt方法是通用的,不僅適用于醫學,還可以推廣到電氣工程、機器學習、法律等專業中。

這項研究在X(原Twitter)一經分享,就引發眾多網友關注。

微軟僅憑「提示工程」讓GPT-4成醫學專家!超過一眾高度微調模型,專業測試準確率首次超90%

沃頓商學院教授Ethan Mollick、Artificial Intuition作者Carlos E. Perez等都有轉發分享。

Carlos E. Perez直呼“出色的提示策略可以甩微調一大截”:

微軟僅憑「提示工程」讓GPT-4成醫學專家!超過一眾高度微調模型,專業測試準確率首次超90%

有網友表示早就有這種預感,現在能看到結果出來,真的是“so cool”:

微軟僅憑「提示工程」讓GPT-4成醫學專家!超過一眾高度微調模型,專業測試準確率首次超90%

還有網友表示這真的很“激進”:

GPT-4是一項能改變行業的技術,而我們還遠沒有觸及提示的極限,也未達到微調極限。

微軟僅憑「提示工程」讓GPT-4成醫學專家!超過一眾高度微調模型,專業測試準確率首次超90%

組合提示策略,“變身”專家

Medprompt是多種提示策略的組合體,包含三大法寶:

  • 動態少樣本選擇(Dynamic few-shot selection)
  • 自生成思維鏈(Self-generated chain of thought)
  • 選項洗牌集成(Choice shuffling ensemble)
微軟僅憑「提示工程」讓GPT-4成醫學專家!超過一眾高度微調模型,專業測試準確率首次超90%

下面我們來一一介紹。

微軟僅憑「提示工程」讓GPT-4成醫學專家!超過一眾高度微調模型,專業測試準確率首次超90%

動態少樣本選擇

少樣本學習可以說是讓模型快速學習上下文的一種最有效的方法。簡單來說,就是輸入一些示例,讓模型快速適應特定領域,并學習遵循任務的格式。

這種用于特定任務提示的少樣本示例通常是固定的,所以對示例的代表性和廣泛性有較高的要求。

之前一種方法是讓領域專家手動制作范例,但即便如此,也不能保證專家策劃的固定的少樣本示例在每個任務中都有代表性。

因此,微軟研究人員提出了動態少樣本示例的方法。

想法是,任務訓練集可以作為少樣本示例的來源,如果訓練集足夠大,那就可以為不同的任務輸入選擇不同的少樣本示例。

具體來說,研究人員先利用text-embedding-ada-002模型為每個訓練樣本和測試樣本生成向量表示。然后,對于每個測試樣本,基于向量相似度,從訓練樣本中挑選出最相似的k個樣本。

與微調方法相比,動態少樣本選擇利用了訓練數據,但不需要對模型參數進行大量更新。

自生成思維鏈

思維鏈(CoT)方法就是讓模型一步一步思考,生成一系列中間推理步驟。

之前一種方法也是依賴專家手動編寫少量的帶有提示思維鏈的示例。

微軟僅憑「提示工程」讓GPT-4成醫學專家!超過一眾高度微調模型,專業測試準確率首次超90%

在這里,研究人員發現,可以簡單地要求GPT-4使用以下提示為訓練示例生成思維鏈:

微軟僅憑「提示工程」讓GPT-4成醫學專家!超過一眾高度微調模型,專業測試準確率首次超90%

但研究人員也指出這種自動生成的思維鏈可能包含錯誤的推理步驟,于是設置了一個驗證標簽作為過濾器,可以有效減少錯誤。

與在Med-PaLM 2模型中專家手工制作的思維鏈示例相比,GPT-4生成的思維鏈基本原理更長,而且分步推理邏輯更細粒度。

選項洗牌集成

除此之外,GPT-4在做選擇題時,可能會存在一種偏見,就是不管選項內容是什么,它會偏向總是選擇A,或者總是選擇B,這就是位置偏差。

為了減少這個問題,研究人員選擇將原來的選項順序打亂重排。比如原先選項是ABCD,可以變成BCDA、CDAB。

然后讓GPT-4做多輪預測,每輪使用選項的一個不同排列順序。如此一來“迫使”GPT-4考慮選項的內容。

最后對多輪預測結果做個投票,選擇最一致、正確的選項。

將以上幾種提示策略組合在一起就是Medprompt,下面來看測試結果。

多項測試最優

在測試中,研究人員采用了MultiMed QA評估基準。

微軟僅憑「提示工程」讓GPT-4成醫學專家!超過一眾高度微調模型,專業測試準確率首次超90%

使用Medprompt提示策略的GPT-4,在MultiMedQA的九個基準數據集中均取得最高分,優于Flan-PaLM 540B、Med-PaLM 2。

此外研究人員還討論了Medprompt策略在“Eyes-Off”數據上的表現,也就是在訓練或優化過程中模型未曾見過的數據中的表現,用于檢驗模型是否過擬合訓練數據。

微軟僅憑「提示工程」讓GPT-4成醫學專家!超過一眾高度微調模型,專業測試準確率首次超90%

結果GPT-4結合Medprompt策略在多個醫學基準數據集上表現出色,平均準確率達到了91.3%。

研究人員還在MedQA數據集上進行了消融實驗,探索了三個組件對于整體性能的相對貢獻。

微軟僅憑「提示工程」讓GPT-4成醫學專家!超過一眾高度微調模型,專業測試準確率首次超90%

其中自動生成思維鏈步驟對性能提升的貢獻最大。

微軟僅憑「提示工程」讓GPT-4成醫學專家!超過一眾高度微調模型,專業測試準確率首次超90%

而且GPT-4自動生成的思維鏈比Med-PaLM 2中專家策劃的得分更高:

微軟僅憑「提示工程」讓GPT-4成醫學專家!超過一眾高度微調模型,專業測試準確率首次超90%

最后,研究人員還探索了Medprompt的跨域泛化能力,取用了MMLU基準中的六個不同的數據集,涵蓋了電氣工程、機器學習、哲學、專業會計、專業法律和專業心理學的問題。

還添加了另外兩個包含NCLEX(美國護士執照考試)問題的數據集。

結果顯示,Medprompt在這些數據集上的效果與在MultiMedQA醫學數據集上的提升幅度相近,平均準確率提高了7.3%。

微軟僅憑「提示工程」讓GPT-4成醫學專家!超過一眾高度微調模型,專業測試準確率首次超90%

論文鏈接:https://arxiv.org/pdf/2311.16452.pdf

參考鏈接:
[1]https://twitter.com/erichorvitz/status/1729854235443884385
[2]https://twitter.com/emollick/status/1729733749657473327

版權所有,未經授權不得以任何形式轉載及使用,違者必究。
国产精品黄页免费高清在线观看| 欧美日韩黄色影视| 亚洲精品一区久久久久久| 成人羞羞国产免费| 免费在线激情视频| 色中文字幕在线观看| 国产又粗又爽又黄的视频| 国产老头和老头xxxx×| 色综合婷婷久久| 久久久99久久精品女同性| 激情深爱综合网| 亚洲日本在线播放| 一级片免费网址| 欧美日韩视频第一区| 久久网站免费视频| 红桃av永久久久| 亚洲欧美天堂在线| 日韩欧美在线影院| 久久亚洲精品无码va白人极品| 国产成人无码一区二区三区在线 | 香蕉视频成人在线| 日本久久精品电影| 成人免费看片网站| 91精品国产色综合久久不卡98口| 国产一区二区三区毛片| 国内精品一区二区三区| 麻豆精品国产传媒| 99久久久免费精品国产一区二区| 亚洲激情视频在线播放| 99在线观看视频免费| 久久精品色欧美aⅴ一区二区| 亚洲国产婷婷香蕉久久久久久99| 亚洲欧美在线视频免费| 亚洲成人激情综合网| 国产精品高清一区二区三区| 久草免费在线视频观看| 亚洲成a天堂v人片| 国产在线精品一区二区三区| 久草国产精品视频| 精品视频一区 二区 三区| 日韩欧美亚洲日产国| 中文字幕激情视频| 精品少妇一区二区| 青青青免费在线| 久久亚洲综合| www.日韩av.com| 亚洲AV成人精品| 久久这里只有精品视频网| 日韩免费黄色av| 亚洲一区电影在线观看| 亚洲va欧美va人人爽| 久久伊人资源站| 91禁在线观看| 亚洲精品网站在线播放gif| 毛片av免费在线观看| 激情成人午夜视频| 欧洲亚洲免费在线| 免费中文字幕在线| 欧美男生操女生| 成人一对一视频| 日本午夜一本久久久综合| 久久成人在线视频| 亚洲天堂av中文字幕| 黑人狂躁日本妞一区二区三区 | 国产一区玩具在线观看| 日本妇女毛茸茸| 欧美一区二区三区播放老司机| 久久亚洲中文字幕无码| 国产精品一区久久久久| 国产精品日韩在线一区| 五月天激情四射| 亚洲国产精品va在线观看黑人| 污污动漫在线观看| 亚洲国产精品v| 日本中文不卡| 六月丁香婷婷色狠狠久久| 欧美在线视频网| 在线观看亚洲欧美| 精品小视频在线| 欧美 日本 国产| 91福利区一区二区三区| 日韩视频在线免费看| 国产欧美日韩在线观看| 精品一区二区三区视频日产| 天堂中文在线资源| 国产91久久婷婷一区二区| 一级黄色在线视频| 久久精品国产2020观看福利| 国产美女福利视频| 亚洲国产日韩欧美在线动漫| 日本aaa视频| 555夜色666亚洲国产免| 欧美熟妇精品一区二区| 色视频成人在线观看免| www,av在线| 欧美性猛xxx| www.色欧美| 精品国产鲁一鲁一区二区张丽| 欧美深夜福利视频| 中文字幕一区二| 久久这里只有精品18| 国产日韩综合av| 亚洲成人动漫在线| 久久精品一区二区三区不卡牛牛 | 18涩涩午夜精品.www| 免费成人进口网站| 国产偷国产偷精品高清尤物| 青青草原网站在线观看| 久久精品水蜜桃av综合天堂| wwwjizzjizzcom| 国产精品热久久久久夜色精品三区| 欧美与动交zoz0z| www国产精品av| 国产一级大片免费看| 久久久久国产免费免费| 欧美做暖暖视频| 亚洲图片你懂的| 色诱视频在线观看| 欧美日韩在线视频一区二区| aaa一级黄色片| 欧美日韩视频第一区| 精品人妻一区二区三区蜜桃视频| 亚洲国产成人91精品| 国产高清在线免费观看| 日韩在线精品一区| 波多野结衣不卡| 国产成人在线播放| 日韩av中文字幕一区二区| 欧美成ee人免费视频| 2020国产精品自拍| 人妻无码视频一区二区三区| 欧洲av在线精品| 欧美成人另类视频| 不卡中文字幕av| www.色呦呦| 久久精品aaaaaa毛片| av激情综合网| 91蝌蚪视频在线观看| 欧美日韩在线一区二区| www欧美com| 久久人人看视频| 日韩中文字幕麻豆| 正在播放久久| 欧美日韩色婷婷| 少妇一级黄色片| 欧美激情18p| 奇米影视一区二区三区小说| 在线成人性视频| 亚洲图片欧美色图| 级毛片内射视频| 欧美国产日韩一区二区在线观看| 凸凹人妻人人澡人人添| 亚洲免费精品视频| 午夜精品福利视频网站| 超薄肉色丝袜一二三| 欧美激情综合色综合啪啪五月| 天天色综合久久| 警花观音坐莲激情销魂小说| 欧美在线影院一区二区| 国产一级在线免费观看| 国产欧美日韩亚洲精品| 亚洲视频香蕉人妖| 992tv快乐视频| 一级做a爱视频| 日韩黄色中文字幕| 久久久蜜桃一区二区| 永久免费看mv网站入口78| 在线成人性视频| 在线成人性视频| 国产一二三四区在线观看| 成人激情电影一区二区| 中文字幕欧美日韩精品| 亚洲精品在线看| 国产视频精品网| 国产熟女高潮一区二区三区| 800av在线播放| 91av在线免费| 中文字字幕在线观看| 国产免费黄视频| 国产白嫩美女无套久久| 伊人网综合视频| 色欲久久久天天天综合网 | 亚洲人成电影网站色www| 97**国产露脸精品国产| 欧美美女黄色网| 亚洲一级片免费观看| 日韩在线一区视频| 亚洲一区和二区| 波多野结衣网站| 国产欧美日韩激情| 国产精品久久久久影院色老大| 99久久精品免费看| 亚洲欧美一区二区久久 | 亚洲成av人综合在线观看| 欧美一区二区高清| 美女久久久久久久| 精品久久久无码人妻字幂| 激情视频一区二区| 免费日韩中文字幕| 欧美三级韩国三级日本三斤在线观看 | 亚洲精品国产精品国自产网站按摩| 一区二区三区日韩欧美| 国产精品香蕉国产| 亚洲视频在线不卡| 国产精品第9页| 国产又黄又猛又爽| 亚洲综合免费观看高清完整版 | 在线观看免费视频高清游戏推荐| 亚洲精品日韩成人| 污污的网站18| 成人激情黄色小说| 欧美狂野另类xxxxoooo| 91网免费观看| 国内自拍第二页| 波多野结衣家庭教师在线观看| 噜噜噜在线视频| 国产一区在线精品| 亚洲男人的天堂在线| 日韩精品一区二区三区四| 在线免费av网| 精品国产免费久久| 午夜久久久久久久久久久| 97伦伦午夜电影理伦片| 欧美自拍偷拍第一页| 久久久精品tv| 日韩av影院在线观看| 欧美亚洲日本网站| 欧美一级片免费播放| 91小视频网站| 小泽玛利亚一区二区免费| 精品在线免费观看| 欧美又大又粗又长| 日本网站在线看| 亚洲男人天堂网址| 欧美丰满艳妇bbwbbw| 99在线热播精品免费| 国产日韩精品一区二区浪潮av | 亚洲精品久久久蜜桃动漫| 国产一区二区久久精品| av小说在线观看| 欧美三片在线视频观看| 欧美视频免费播放| 国产精品99久久久久久久女警| 国产免费一区二区三区香蕉精| 中国女人特级毛片| 91原创在线视频| 欧美xxxx在线观看| 久久国产精品99久久久久久丝袜 | 国产剧情在线视频| 国产精品一区一区三区| 日韩欧美高清在线| 91网站在线观看免费| 日韩成人午夜精品| 久久五月天色综合| 精品成在人线av无码免费看| 97视频免费在线| 日韩在线视频播放| 久久国产欧美精品| 成人免费看aa片| 欧美性色黄大片| 一本一道久久a久久精品综合| 国产伦精品一区二区三区视频我| 日韩欧美在线网站| 中文字幕在线导航| 成人欧美一区二区三区视频网页| 亚洲在线一区二区| 国产精品1区2区3区4区| 亚洲同性同志一二三专区| 国产精品人成电影| 蜜臀久久99精品久久久久久| 中文字幕在线一区免费| 国产日韩欧美在线观看| 右手影院亚洲欧美| 天天爱天天干天天操| 色综合久久99| 92国产精品视频| 69亚洲乱人伦| 国产一区二区三区香蕉 | 亚洲精品成人在线播放| 成人一区在线看| 成年无码av片在线| 国产大片中文字幕在线观看| 精品国产伦理网| 免费成人深夜夜行网站| 久久国产精品免费视频| 亚洲精品喷潮一区二区三区| 成人永久免费| 国产调教视频一区| 欧美日韩怡红院| 国产亚洲一区二区三区在线观看| 成人免费观看a| 久久久视频6r| 欧美性感美女h网站在线观看免费| 一级做a爰片久久| 国产资源精品在线观看| 欧美在线视频一区二区| 黄色免费一级视频| caoporm超碰国产精品| 综合国产在线观看| 欧美一级黄色影院| 国产大片一区二区| 97在线看免费观看视频在线观看| 日本wwwwwww| 精品国产精品自拍| 国产xxxxhd| 91国内精品野花午夜精品 | 色综合久久88色综合天天6| 奇米视频7777| 日本韩国欧美在线| 久久免费手机视频| 国产精品第1页| 国产成人免费视| 国产视频九色蝌蚪| 精品色蜜蜜精品视频在线观看| 国产一二三在线视频| 亚洲视频一区在线观看| 欧美视频在线第一页| 国产成a人无v码亚洲福利| 加勒比在线一区二区三区观看| 国产精品永久久久久久久久久| 高清免费日韩| 精久久久久久久久久久| 久久婷婷国产麻豆91天堂| 麻豆精品国产传媒av| 亚洲黄色录像片| 久久久国内精品| 福利电影一区二区| 亚洲一区二区三区在线免费观看| 人妻一区二区三区免费| 欧美日韩一区二区视频在线| 2020国产成人综合网| 欧美激情国产日韩| 欧美国产乱子伦| 久久久国内精品| 亚洲精品suv精品一区二区| 好吊视频一区二区三区| 少妇久久久久久被弄到高潮| 亚洲黄页视频免费观看| 日韩中文字幕免费在线观看| 在线观看成人av电影| 久久综合色8888| www.com日本| 日韩一区二区电影网| 香蕉久久久久久久| 久久精品国产2020观看福利| 亚洲国产精品二区| 大胆欧美熟妇xx| 午夜视频久久久久久| 996这里只有精品| 亚洲自拍偷拍麻豆| 中文字幕在线观看日 | 最近中文字幕一区二区三区| 亚洲妇熟xx妇色黄蜜桃| 日韩精品视频在线观看免费| 精品人妻av一区二区三区| 成人免费在线视频网址| 国产精品国产三级国产a| aaa一级黄色片| 欧美一区深夜视频| 精品久久久久久亚洲精品| 国产人妖一区二区三区| 亚洲天堂网2018| 国语自产偷拍精品视频偷| 精品久久久视频| 成人h动漫精品一区二区无码 | 免费在线观看一级片| 国产精品久久在线观看| 久久精品人人爽人人爽| 亚洲精品无码久久久久久久| 国产一区二区成人| 国产精品亚洲а∨天堂免在线| 国产精品乱码久久久久| 欧美日韩国产中文精品字幕自在自线 | 欧美性猛交xxxx乱大交蜜桃| 国产精品视频看看| 国产美女久久久| 国产精品私人自拍| 欧美国产在线看| 欧美成人免费在线| 亚洲精品一二区| 中文字幕一区二区久久人妻| 国产精品69久久久| 一个人www欧美| 狠狠色狠狠色综合系列| 久久久久久免费观看| 国产精品欧美激情在线观看| 日本欧洲国产一区二区| 51ⅴ精品国产91久久久久久| 亚洲小视频在线观看| 一区二区三区小说| 天天干天天舔天天射| 亚洲人人夜夜澡人人爽| 91九色蝌蚪嫩草| 欧美性生交大片免费| 国产一区二区在线视频聊天| 国产成人在线小视频| 中文字幕在线日韩| 蜜桃传媒麻豆第一区在线观看| 泷泽萝拉在线播放| 亚洲精品国产一区| 欧美精品激情在线观看| 久久美女艺术照精彩视频福利播放| 中文字幕无码毛片免费看| 久久久亚洲成人| 国产精品日韩精品欧美在线 | 亚洲二区视频在线| 中文字幕+乱码+中文乱码www| 亚洲熟妇无码一区二区三区导航| 久久精品国产99国产精品澳门| 一区二区三区欧美久久|