色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

AI慢思考蒸餾進(jìn)快思考,Llama2升至GPT4水平,不寫過程也能做對題

用“慢思考”微調(diào)“快模型”

克雷西 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

《思考快與慢》中人類的兩種思考方式,屬實(shí)是被Meta給玩明白了。

研究人員通過把AI的“慢思考”結(jié)果蒸餾進(jìn)“快思考”,讓Llama2表現(xiàn)提升了257%,變得比GPT4還能打,同時還能降低推理成本。

圖片

這里的快慢兩種思考方式,指的就是2002年諾貝爾經(jīng)濟(jì)學(xué)獎得主丹尼爾·卡尼曼推廣的系統(tǒng)1和系統(tǒng)2——

簡單說,系統(tǒng)1是簡單無意識的直覺,速度更快;系統(tǒng)2則是復(fù)雜有意識的推理,準(zhǔn)確性更強(qiáng)。

Meta所做的“蒸餾”,就是用系統(tǒng)2生成數(shù)據(jù),然后對用系統(tǒng)1推理的模型進(jìn)行微調(diào)。

有網(wǎng)友看了后表示,這種模式和人類很像,一旦解決了一個難題,再解決(相似的問題)就變得簡單了。

圖片

將系統(tǒng)2蒸餾到系統(tǒng)1

對于大模型而言,模仿人類的“系統(tǒng)2”的方式有很多種,在模型中所處的環(huán)節(jié)也不盡相同,這里作者一共研究了四種:

  • CoT,即Chain of Thought,思維鏈,從提示詞入手讓模型逐步思考;
  • S2A,即System 2 Attention,由Meta自己提出,直接修改了模型的注意力機(jī)制,屏蔽與任務(wù)無關(guān)的信息;
  • RaR,即Rephase and Respond,先對問題進(jìn)行重新表述,再根據(jù)重述后的問題生成答案;
  • BSM,即Branch-Solve-Merge,將復(fù)雜任務(wù)分解為多個分支,針對每個分支獨(dú)立生成評分,再將各個分支的評分綜合。

圖片

但從整體流程上看則是殊途同歸,各種“系統(tǒng)2方法”都會在未標(biāo)注數(shù)據(jù)集上生成推理結(jié)果。

在這過程當(dāng)中,模型會在給出結(jié)果的同時生成詳細(xì)的中間推理步驟,但研究人員只保留最終的輸出結(jié)果

然后就得到了輸入-系統(tǒng)2輸出的數(shù)據(jù)對,可以視為一種無監(jiān)督的“偽標(biāo)簽”,將這些數(shù)據(jù)對收集起來,就形成初步的蒸餾數(shù)據(jù)集。

當(dāng)然了,這步得到的數(shù)據(jù)還不能直接拿來微調(diào)系統(tǒng)1模型,需要進(jìn)行過濾以確保其擁有足夠高的質(zhì)量。

過濾的具體依據(jù),是一致性和魯棒性

一致性篩選當(dāng)中,對每個輸入樣本,都會用系統(tǒng)2模型采樣生成多個輸出,然后通過多數(shù)投票等方法進(jìn)行比較,如果大多數(shù)都一致,則認(rèn)為該輸出是可靠的;

魯棒性篩選是對一個輸入樣本進(jìn)行適當(dāng)?shù)臄_動,如改變無關(guān)細(xì)節(jié)、調(diào)整詞序等,然后觀察系統(tǒng)2模型在擾動前后的輸出是否一致。

篩選后的高質(zhì)量蒸餾數(shù)據(jù),就可以對系統(tǒng)1模型進(jìn)行無監(jiān)督微調(diào)了。

圖片

微調(diào)過程可以看作是一種知識蒸餾,但又與與傳統(tǒng)的知識蒸餾不同,這里兩種系統(tǒng)使用的是同一個基礎(chǔ)模型。

系統(tǒng)1模型的目標(biāo)是直接學(xué)到系統(tǒng)2模型的輸出行為,而不是中間的復(fù)雜推理過程,在后續(xù)推理時也不需要執(zhí)行系統(tǒng)2的推理步驟,而是直接生成輸出。

但從輸出質(zhì)量上來看,表現(xiàn)卻能接近系統(tǒng)2模型,也就是實(shí)現(xiàn)了系統(tǒng)2能力向系統(tǒng)1的轉(zhuǎn)移。

那么,為什么要專門收集數(shù)據(jù)去微調(diào)系統(tǒng)1模型,而不直接用系統(tǒng)2模型推理呢,作者也給出了解釋。

道理其實(shí)很簡單,從系統(tǒng)2的另一個名字“慢系統(tǒng)”當(dāng)中,很容易就能看出答案:

因?yàn)橄到y(tǒng)2的速度慢,在實(shí)時交互、移動設(shè)備部署等場景下,模型的延遲可能是無法接受的。

另外,由于需要輸出完整的推理過程,系統(tǒng)2輸出的token長度也是系統(tǒng)1的數(shù)百倍。

就像開頭那位網(wǎng)友說的,系統(tǒng)2把復(fù)雜的推理解決了,再將數(shù)據(jù)喂給系統(tǒng)1,問題對其而言也會變得容易。

從表現(xiàn)上看,這樣的模式也確實(shí)讓系統(tǒng)1模型的表現(xiàn)大幅進(jìn)步,甚至超過了真·系統(tǒng)2模型。

讓Llama2超越GPT-4

針對前面四種不同的系統(tǒng)2方法,研究人員分別使用不同的數(shù)據(jù)集,在不同的任務(wù)上進(jìn)行了測試。

針對BSM方法,作者采用的數(shù)據(jù)集是Open Assistant 2和MT-bench,評估了模型作為“評判者”時的表現(xiàn)。

可以看到,在兩個數(shù)據(jù)集中,Llama-2的表現(xiàn)(人類一致性)分別從32.0%和28.1%,提高到了58.4%和72.4%,最高增幅達(dá)到了257%,比CoT方法更加有效。

而且,微調(diào)后的模型均超過了系統(tǒng)1版的GPT-4,甚至達(dá)到了GPT-4配合CoT的水準(zhǔn)

同時(改變選項(xiàng)位置后的)不一致性也大幅降低,而且和系統(tǒng)2相比,Token數(shù)量少到幾乎可以忽略不計(jì)。

圖片

同時針對MT-Bench不同的子類任務(wù),作者也分別分析了各種方法的人類一致性。

圖片

接下來是S2A方法,它主要解決的是模型偏見問題,因此評估時采用了帶偏見的TriviaQA任務(wù)。

結(jié)果蒸餾后的準(zhǔn)確率達(dá)到81.3%,超過了原始S2A的76%,生成的token數(shù)量也從147個減少到了56個。

圖片

RaR的測試目標(biāo)則是完成一些推理任務(wù),這里作者測試了Last letter concatenation和Coin flip。

在Letter任務(wù)中,蒸餾后的系統(tǒng)模型準(zhǔn)確率從30%飛升到了98%,也超過了系統(tǒng)1自蒸餾的69.5%,同時也優(yōu)于原始的RaR方式。

而在Coin flip任務(wù)里,蒸餾后的準(zhǔn)確率達(dá)到 75.69%,也與接近2-步原始RaR的77.2%接近,但生成的token數(shù)量大幅減少

圖片

不足的一點(diǎn)是,CoT的蒸餾效果與另外三種大相徑庭,作者發(fā)現(xiàn),在數(shù)學(xué)推理任務(wù)上,CoT的推理能力很難遷移到系統(tǒng)1當(dāng)中。

在GSM8K數(shù)據(jù)集上,蒸餾后的模型在k=1時準(zhǔn)確率僅為7.13%,k=10時也只有7.35%,甚至不如沒蒸餾之前的版本。

圖片

所以,作者認(rèn)為,接下來的研究目標(biāo)是進(jìn)一步明確這種蒸餾的應(yīng)用場合,找到更類似于人類學(xué)習(xí)的方式。

論文地址:
https://arxiv.org/abs/2407.06023
參考鏈接:
https://x.com/emollick/status/1810659417634869610

版權(quán)所有,未經(jīng)授權(quán)不得以任何形式轉(zhuǎn)載及使用,違者必究。
欧美色另类天堂2015| 国产女人aaa级久久久级 | 又色又爽又高潮免费视频国产| 亚洲一卡二卡三卡四卡无卡网站在线看 | 视频一区视频二区视频三区视频四区国产 | 色国产在线视频| 亚洲综合激情视频| av电影在线播放| 97超碰在线资源| 欧美日韩人妻精品一区二区三区| 精品午夜福利视频| 亚洲无码精品在线观看| 亚洲aaa在线观看| 国产精品一区专区| 日本午夜精品视频在线观看| 天堂成人在线观看| 国产成人免费xxxxxxxx| 欧美激情综合网| 亚洲国产精品欧美一二99| 在线精品观看国产| 精品日韩在线观看| 蜜臀久久99精品久久久久久宅男| 91精品国产一区| 91麻豆国产语对白在线观看| 免费av一区二区三区| 屁屁影院ccyy国产第一页| 亚洲色图久久久| 精品无码一区二区三区| jizz中文字幕| 中文字幕第315页| 麻豆成人av在线| 亚洲国产高清aⅴ视频| 精品国产91久久久久久| 日韩第一页在线| 91国产高清在线| 国产一区在线免费| 国产婷婷一区二区三区| 日韩少妇一区二区| 国产又大又粗又爽| 国产综合一区二区| 亚洲欧美一区二区三区极速播放 | 亚洲人精选亚洲人成在线| 久久免费视频在线观看| 欧美日本韩国一区二区三区| 男人舔女人下面高潮视频| 中文字幕一二三四区| 国产微拍精品一区| 精品一区二区影视| 亚洲制服丝袜av| 日韩精品极品毛片系列视频| 久久这里只有精品99| 成人欧美一区二区三区黑人免费| 少妇高潮喷水在线观看| 国产免费嫩草影院| 人妻精品一区二区三区| 中文字幕永久在线不卡| 亚洲成人网av| 91久久久久久久久久| 激情伊人五月天| 欧美精品成人久久| av资源免费看| 中文字幕中文字幕在线一区| 亚洲精品成人久久| 99re视频| 国产无遮挡猛进猛出免费软件 | 51国产成人精品午夜福中文下载| 亚洲色图都市激情| 国产乱子轮xxx农村| 久久综合婷婷| 欧美日韩国产精品专区| 欧美大尺度在线观看| 亚洲一二三区精品| 中文字幕人妻一区| 日本免费网站在线观看| 午夜伊人狠狠久久| 26uuu另类亚洲欧美日本一| 日韩a级在线观看| 日韩精品久久久久久久的张开腿让| 人人妻人人玩人人澡人人爽| 亚洲韩国一区二区三区| 69av在线视频| 国产精彩免费视频| 亚洲一卡二卡在线| 亚洲三级在线免费| 亚洲人成网站999久久久综合| 精品高清视频| 在线观看日本中文字幕| 国产美女在线精品| 日韩成人中文电影| 一区二区精品在线| 久久久久久天堂| 久久久久久电影| 久久综合国产精品台湾中文娱乐网| 久久国产精品-国产精品| a级片在线观看| 国产精品99久久久久久久vr| 精品久久一区二区| 日韩激情久久| 西西44rtwww国产精品| 一色桃子久久精品亚洲| 欧美亚洲成人网| 性xxxxxxxxx| 精品国产一区二区三区不卡| 久久91精品国产| 97国产一区二区精品久久呦| 欧美日韩一区二| 欧美性xxxx图片| 99精品在线视频观看| 成人夜色视频网站在线观看| 91尤物国产福利在线观看| 想看黄色一级片| 麻豆精品一区二区三区视频| 午夜一级黄色片| 四虎免费在线观看| eeuss国产一区二区三区| 亚洲第一成人av| 久久精品亚洲天堂| 国产伦精品一区二区三区妓女下载| 黄色一级片国产| 欧美色图17p| 91麻豆国产福利在线观看| 久久九九国产精品怡红院| 好色先生视频污| 一级α片免费看刺激高潮视频| 五月天一区二区| 国产超碰91| 伊人365影院| 福利微拍一区二区| 97免费资源站| 中文字幕国产专区| 国产精品久久久久永久免费观看 | 久久久99爱| 日本一级淫片免费放| 亚洲第一在线综合网站| 国产成人精品日本亚洲11| 国产在线观看免费av| 亚洲h在线观看| 欧美精品亚洲精品| 国产一区二区在线视频观看| 精品国产99国产精品| 99在线观看视频免费| 日韩激情一区二区| xxx一区二区| 国产二级一片内射视频播放 | 亚洲日韩欧美视频| 国产青青在线视频| 麻豆精品在线观看| 91国内在线视频| 久久久久亚洲av片无码| 亚洲妇熟xx妇色黄| 中文字幕中文字幕在线中心一区| 人妻夜夜爽天天爽| 久久视频在线直播| 男人操女人下面视频| 亚洲国产精华液网站w| 国产区日韩欧美| 精品国产青草久久久久96| 337p日本欧洲亚洲大胆精品| 精品国产区在线| 男人天堂av网| 性欧美xxxx交| 精品无码久久久久成人漫画| 在线视频你懂得一区二区三区| 成人性做爰片免费视频| 亚洲毛片欧洲毛片国产一品色| 中文字幕精品在线视频| 五月婷婷综合在线观看| 亚洲乱码国产乱码精品精98午夜 | 久久久久久久久一| 国产亚洲精品久久飘花| 精品久久国产视频| 久久久这里只有精品视频| 九九免费精品视频| 精品视频一区二区三区免费| 91国产精品视频在线观看| 一二三四在线观看视频| 日韩av网站在线| 午夜免费一级片| 一本大道综合伊人精品热热 | 老鸭窝一区二区久久精品| 日韩在线欧美在线国产在线| 懂色av中文一区二区三区| 久久久婷婷一区二区三区不卡| 国产福利不卡视频| 亚洲欧美另类动漫| 精品久久久久99| 久久精品网站视频| 在线观看一区二区视频| 中文字幕理论片| 亚洲图片小说在线| 欧美色视频在线| 国产一卡二卡三卡四卡| 亚洲国产成人高清精品| 两性午夜免费视频| 亚洲精品在线三区| 自拍视频一区二区| 亚洲大片一区二区三区| 亚洲午夜福利在线观看| 国产日韩视频在线观看| 亚洲欧洲综合在线| 可以免费观看av毛片| 亚洲高清一二三区| 中文字幕乱码在线| 精品国产伦一区二区三区免费| 国产又粗又猛又爽又黄视频| 亚洲免费999| 激情视频一区二区| 欧洲精品一区二区| 风流少妇一区二区| 女同性恋一区二区三区| 欧美成人一区二区| 久草热8精品视频在线观看| 青青草原国产在线视频| 欧美激情第6页| 国产午夜无码视频在线观看 | 欧美一级电影免费在线观看| 中文字幕在线一区| 日韩aaaaa| 成人妇女淫片aaaa视频| 亚洲妇女屁股眼交7| 三级在线观看免费大全| 亚洲精品一区二区精华| 国产亚洲欧美一级| 国产99对白在线播放| 日本少妇激三级做爰在线| 色欲综合视频天天天| 成人av免费在线播放| 午夜久久久久久久久久| 国精产品一区一区二区三区mba| 三级4级全黄60分钟| 久久久久久久久久久成人| 国产一区二区免费看| 国产a级黄色片| 无码人妻精品一区二区蜜桃百度| 怡红院精品视频| 日批视频免费播放| 久久av秘一区二区三区| 亚洲天堂av图片| 精品国产鲁一鲁一区二区张丽| 中文字幕第一页久久| 国产女主播喷水视频在线观看| 97免费公开视频| 一区精品在线| 亚洲精品720p| www.久久综合| 国产一二三四视频| 日韩av加勒比| 天堂视频免费看| 97超碰人人看| 91无套直看片红桃在线观看| 捆绑裸体绳奴bdsm亚洲| 91香蕉视频网| 国产天堂在线播放| 国产精品麻豆va在线播放| 欧美日韩亚洲视频| 亚洲成人777| 久久久久久久波多野高潮日日| 久久99久久98精品免观看软件 | 亚洲成人福利视频| 中文人妻一区二区三区| av无码av天天av天天爽| 久久国产精品一区二区三区四区| 97热在线精品视频在线观看| 日韩av在线网页| 国产精品国产三级国产三级人妇| 小早川怜子久久精品中文字幕| 人妻体内射精一区二区三区| 国产日韩欧美久久| 激情综合在线观看| 亚洲一二三不卡| 东京热无码av男人的天堂| 亚洲精品视频久久久| 黄色aaaaaa| 久久久久久久免费视频| 999国产视频| 国产97人人超碰caoprom| 国产一区二区三区毛片| 久久精品国产成人精品| 亚洲欧美一区二区三区久本道91 | 亚洲精品国产suv一区88| 欧美在线一级视频| 成人污污视频在线观看| 国产精品久久久久国产精品日日 | 中文字幕国产一区| 国产欧美精品一区二区色综合| 国产亚洲综合色| 日韩精品一区二区三区四区| 国产精品91在线观看| 国产一区二区片| 国产精品综合激情| 日韩高清不卡在线| 国产精品第13页| 26uuu亚洲综合色| 91丝袜美腿高跟国产极品老师 | 亚洲无人区一区| 国产午夜精品一区二区三区视频 | www.亚洲色图| 成人精品小蝌蚪| 亚洲欧美日韩久久| 色诱视频网站一区| 国产精品 欧美精品| 国产精品高潮呻吟久久| 欧美一区二区精品在线| 亚洲第一av在线| 亚洲www在线| 国产成人精品综合久久久久99| 中文字幕一区二区人妻视频| 99精品国产视频| 亚洲欧美另类综合偷拍| 在线观看91精品国产入口| 色综合久久66| 亚洲人成在线电影| 午夜精品久久久久久久久久久久久 | 老司机精品视频导航| 国产又黄又大久久| 亚洲视频一区二区在线| 亚洲精品国精品久久99热一| 日韩欧美aaaaaa| 亚洲成av人综合在线观看| 欧美精品777| 中国china体内裑精亚洲片| 国自产精品手机在线观看视频| 在线电影中文日韩| 国产成人亚洲精品| 超碰97在线人人| 99国产盗摄| 亚洲免费观看视频| 欧美美女网站色| 中文字幕欧美日韩| 国产欧美一区二区三区不卡高清| 在线电影看在线一区二区三区| 可以看污的网站| 久久综合久久鬼| 日日夜夜免费精品| 国模娜娜一区二区三区| 亚洲在线免费播放| 亚洲成人1234| 美女精品久久久| 成人资源视频网站免费| www亚洲成人| 一女二男一黄一片| 国产激情视频一区二区在线观看| 久久精品亚洲麻豆av一区二区 | 国产精品私人影院| 无码人妻丰满熟妇区bbbbxxxx| 丰满人妻一区二区三区免费| 一区二区三区在线播放| 久久6精品影院| 亚洲欧美色图视频| 亚洲婷婷综合色高清在线| 98国产高清一区| 佐佐木明希av| 久久精品久久99精品久久| 日韩在线视频线视频免费网站| 四虎精品欧美一区二区免费| 中文字幕在线观看91| 中文字幕欧美在线观看| 99久久免费国产精精品| 亚洲激情五月婷婷| 国产精品久久av| 久久av无码精品人妻系列试探| 精品制服美女久久| 国产精品色婷婷| 亚洲级视频在线观看免费1级| 日韩美女主播视频| 麻豆中文字幕在线观看| 97精品人妻一区二区三区香蕉| 欧美日韩国产一区中文午夜| 亚洲国产成人精品女人久久久 | 免费的毛片视频| 97人妻精品一区二区三区软件| 亚洲三级在线免费观看| 成人欧美一区二区三区黑人免费| 日韩aaaaa| 亚洲在线观看免费| 亚洲综合色av| 婷婷久久久久久| 国内精品视频免费| 性生交大片免费全黄| 在线观看91精品国产麻豆| 亚洲欧美国产中文| 日韩精品国产欧美| 亚洲国产欧美在线| 国产精品福利无圣光在线一区| 五月婷婷之婷婷| 手机av在线免费观看| 国产一区二区日韩| gai在线观看免费高清| 五月天福利视频| 亚洲人免费视频| 成年网站在线免费观看| 日本黄色大片视频| 欧美一级免费看| 一道本在线观看| 亚洲视频一二区| 日韩极品视频在线观看| 精品亚洲成a人| 欧美激情综合色| 精品在线一区| 九九免费精品视频| 欧美高清hd18日本| 免费拍拍拍网站| 99久久精品国产导航| 97在线免费视频观看| 看国产成人h片视频| 国产又粗又大又爽的视频| 亚洲欧美日韩久久精品| 欧美牲交a欧美牲交| 午夜成人免费视频| 国产又爽又黄ai换脸|