色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

大模型生成提速2倍!單GPU幾小時搞定微調,北大數院校友共同一作丨開源

比投機采樣更簡單好用

蕭簫 發自 凹非寺
量子位 | 公眾號 QbitAI

只需給大模型“加點小零件”,推理速度立刻提升2倍!

大模型生成提速2倍!單GPU幾小時搞定微調,北大數院校友共同一作丨開源

不需要額外訓練一個模型,也不需要對計算硬件做優化,單張A100最快幾小時就能微調完成。

這項新研究名叫Medusa(美杜莎),來自普林斯頓、UIUC、CMU和康涅狄格大學,FlashAttention作者Tri Dao也在其中。

大模型生成提速2倍!單GPU幾小時搞定微調,北大數院校友共同一作丨開源

目前,它已經成功部署到伯克利70億參數的“駱馬”Vicuna中,后續還會支持其他大模型,已經登上GitHub熱榜:

大模型生成提速2倍!單GPU幾小時搞定微調,北大數院校友共同一作丨開源

但其實,在這種方法推出之前,業界并非沒有大模型推理加速方法,主流的就是DeepMind推出的投機采樣(speculative decoding)。

相比這種方法,Medusa有什么不一樣的地方?

投機采樣的2個“bug”

要想加速大模型推理,需要先知道究竟是什么“限制”了它的速度。

相比計算量的增加,大模型推理速度更容易受到內存帶寬的影響(memory bound)。

這是因為,大模型由于參數量巨大、遠超緩存容量,因此推理時需要先把權重從外部內存(顯存)讀取一次到緩存中,這個過程受內存帶寬限制,速度通常很慢。

大模型生成提速2倍!單GPU幾小時搞定微調,北大數院校友共同一作丨開源

因此,模型做批量推理(batch inference)時,一次處理100個tokens和一個tokens時間上區別不大。

基于這個特點,DeepMind去年11月想出了一個名叫投機采樣的神奇操作——

訓練一個更小的模型(draft模型),給大模型提前生成一批“候選詞”,相比于讓大模型自己“思考”生成,直接做“選擇”就好。

大模型生成提速2倍!單GPU幾小時搞定微調,北大數院校友共同一作丨開源

由于小模型生成速度比大模型快好幾倍,一旦大模型覺得小模型已有的詞“可用”,就直接拿來,不用自己再緩慢生成一遍。

這個過程,有點像是輸入法的聯想詞候選,在我們(大模型)想好下一個詞用什么之前,輸入法(小模型)先給列出一些備選項:

要是看到覺得不錯,就從中選一個用;要是覺得生成的都不行,就pass掉自己重新打。

大模型生成提速2倍!單GPU幾小時搞定微調,北大數院校友共同一作丨開源

這種投機采樣方法確實取得了顯著成效,甚至能輕輕松松在M2 Ultra上以高精度跑340億參數LLaMA大模型。

大模型生成提速2倍!單GPU幾小時搞定微調,北大數院校友共同一作丨開源

BUT,這種方法存在兩個問題。

一方面,給大模型找個生成“候選詞”的draft小模型,沒那么容易。

這個小模型可不是隨便抓個生成模型就能用,除了接口統一、概率分布接近等要求,生成質量也不能比大模型差太多。

對于Meta發布的LLaMA這種模型可能還好,既有幾百億參數的大模型版本,又有幾十億參數的小模型版本,可以把參數量更小的版本拿來當draft模型使用。

但對于其他開源大模型,這種方法就不太適用了,自己去搭建訓練一個小模型,不僅時間成本更高,生成效果可能還不達預期。

另一方面,雙模型的組合,使得后續要想做系統調優變得更復雜

這是因為,相比于大模型自身是一個系統,新增加的draft模型相當于又引入了一個系統。

這樣會導致模型部署起來更復雜,包括額外的網絡傳輸、不同的硬件條件都需要考慮到,在做計算優化時難度也會進一步提升。

為了解決這些問題,Medusa出現了。

不用小模型,加幾個“頭”就行

Medusa(美杜莎,一種長有多個頭的妖怪)是一種新的大模型推理加速方法。

相比投機采樣,它選擇直接給Transformer大模型多加幾個解碼頭(decoding heads),每個頭都是一個單層前饋網絡。

大模型生成提速2倍!單GPU幾小時搞定微調,北大數院校友共同一作丨開源

這幾個多出來的解碼頭,可以讓大模型直接一次多生成幾個詞,而不是“擠牙膏式”一個一個生成。

生成準確率也還可以,在預測“下一個詞的下一個詞”時,Medusa準確率達到了60%,還在不斷優化中。

隨后,結合樹狀注意力機制(tree-based attention mechanism)并行驗證這些詞,從而實現推理加速。

大模型生成提速2倍!單GPU幾小時搞定微調,北大數院校友共同一作丨開源

基于Medusa,Vicuna的70億、130億和330億參數大模型推理速度,均有了1.9倍以上的效率提升:

大模型生成提速2倍!單GPU幾小時搞定微調,北大數院校友共同一作丨開源

針對70億參數的模型,研究者們還在不同任務上測試了一下加速效果,顯示最高在代碼生成上有2.15倍的速度提升。

大模型生成提速2倍!單GPU幾小時搞定微調,北大數院校友共同一作丨開源

最關鍵的是,用上Medusa后,并不需要將整個大模型重新訓練一遍。

相比之下,它可以和大模型一起訓練,只需要凍結大模型的參數就行,甚至單個GPU就能搞定。

由于不增加額外的模型,對于分布式推理也很友好。

作者介紹

這項研究有兩位共同一作。

共同一作蔡天樂,普林斯頓大學博士生,研究方向包括優化、表示學習、架構設計等,本科畢業于北京大學數學科學學院,獲得應用數學和計算機科學雙學位。

大模型生成提速2倍!單GPU幾小時搞定微調,北大數院校友共同一作丨開源

共同一作Yuhong?(Jesse)?Li,伊利諾伊大學香檳分校(UIUC)博士生,研究方向是高效機器學習,本科畢業于北京郵電大學。

大模型生成提速2倍!單GPU幾小時搞定微調,北大數院校友共同一作丨開源

此外,這項研究也有FlashAttention作者、斯坦福博士Tri Dao的參與。

FlashAttention是一種能加快注意力并減少內存占用的方法,相比PyTorch標準注意力實現,最高能提速9倍。

大模型生成提速2倍!單GPU幾小時搞定微調,北大數院校友共同一作丨開源

GitHub地址:
https://github.com/FasterDecoding/Medusa

研究地址:
https://sites.google.com/view/medusa-llm

版權所有,未經授權不得以任何形式轉載及使用,違者必究。
波多野结衣高清在线| 欧美日韩精品中文字幕一区二区| 色综合亚洲欧洲| 日韩精品一区二区三区在线| 亚洲四色影视在线观看| 性色av一区二区三区| 91嫩草视频在线观看| av动漫在线播放| 手机免费看av片| 免费看日韩毛片| 久久综合激情| 波多野结衣理论片| 亚洲伦在线观看| 亚洲第一福利网站| 国产精品2018| 看一级黄色录像| av无码一区二区三区| 一级黄色在线观看| 一区二区三区在线观看网站| 日韩av影视综合网| 国产高清视频一区三区| 国产九九九视频| 日韩免费一级片| 中文字幕精品在线不卡| 日韩精品最新网址| 亚洲成人av动漫| 欧美乱大交xxxxx潮喷l头像| 精品人妻互换一区二区三区| 国产女人高潮的av毛片| 久久精品一区二区三区不卡| 91精品啪在线观看国产60岁| 韩国美女主播一区| 亚洲黄色片免费看| 91精东传媒理伦片在线观看| 久久精品亚洲国产奇米99| 久久国产精品久久久久久| 日韩高清国产一区在线观看| 欧美日韩一区二区三区四区五区六区| 久久成人久久爱| 欧美日韩亚洲视频| 欧美与欧洲交xxxx免费观看| 欧美精品久久久久久久自慰| 国产一区二区在线不卡| 91精品国产色综合久久不卡电影 | 美女精品在线观看| 一区二区三区 在线观看视频| 亚洲男人第一网站| 欧美午夜免费| 成人免费一级片| 制服丝袜一区二区三区| 日韩成人手机在线| 日本少妇在线观看| 国产女主播视频一区二区| 色偷偷噜噜噜亚洲男人的天堂| 亚洲在线不卡| 精国产品一区二区三区a片| 成人a免费在线看| 精品亚洲va在线va天堂资源站| 国产欧美一区二区三区另类精品| 人妻少妇精品视频一区二区三区| 日日夜夜免费精品视频| 91精品国模一区二区三区| 日韩亚洲欧美一区二区| av资源免费看| 色婷婷av一区二区三区gif| 国产精品美腿一区在线看| 少妇一级淫免费放| 99国产在线播放| 亚洲美女av网站| 日韩欧美国产片| 亚州av在线播放| 日韩一区二区三| 久久综合色一本| av成人免费网站| 中日韩av电影| 欧美日韩免费高清| 无码国产精品一区二区免费16| 最新的欧美黄色| 国产综合精品在线| 2014亚洲片线观看视频免费| 久久91亚洲人成电影网站| 午夜激情在线观看视频| 亚欧在线观看视频| 欧美性在线观看| 精品少妇theporn| 亚洲天堂免费在线观看视频| 国产精品96久久久久久| av大片免费在线观看| 欧美大片在线观看一区二区| a级大片免费看| 亚洲精品国产a| av久久久久久| 成人毛片在线观看| 国产69精品久久久久9999| 亚洲AV无码久久精品国产一区| 国内精品第一页| 久久亚洲电影天堂| 一二三av在线| 一区二区三区在线高清| www成人免费| 91视频免费看| 欧美自拍视频在线观看| 国产精品三级在线观看无码| 99re成人精品视频| 国产精品尤物福利片在线观看| 毛片视频免费播放| 一个色在线综合| 久色视频在线播放| 久久99最新地址| 147欧美人体大胆444| 可以免费观看的毛片| 日韩精品福利网站| 91成人精品一区二区| 夜夜爽夜夜爽精品视频| 成人在线免费观看av| 久久国产精品72免费观看| 亚洲999一在线观看www| 亚洲精品成人在线视频| 欧美一区二区三区四区五区 | 中日精品一色哟哟| 欧美日韩视频第一区| 青青草影院在线观看| 久久久久久久久久久久久夜| 国产欧美精品aaaaaa片| 亚洲特黄一级片| 情侣黄网站免费看| 国产91对白在线观看九色| 国产成人av在线播放| 精品人妻一区二区三区麻豆91| 亚洲一区二区久久久| 亚洲国产精品第一页| 中文字幕一区二区三区色视频 | 亚洲 精品 综合 精品 自拍| 亚洲一区二区三区久久| 韩国三级电影一区二区| 一区在线电影| 天天摸夜夜添狠狠添婷婷| 成人手机在线免费视频| 激情久久久久久久久久久久久久久久| 亚洲一二三区精品| 亚洲美女一区二区三区| 亚洲色图 在线视频| 欧美精品国产精品| 任我爽在线视频精品一| 3atv一区二区三区| 日韩专区第一页| 中文字幕精品网| www日韩精品| 久久韩剧网电视剧| 波多野结衣电影在线播放| wwwwww欧美| 国产精品香蕉视屏| 欧美一区二区三区喷汁尤物| 亚洲欧美日韩在线| 一区二区视频在线| 三级精品在线观看| 国产精品999.| 欧美激情第99页| 国产精品免费av一区二区| 亚洲中文字幕无码中文字| 7799精品视频| 亚洲黄色小说网址| 91福利视频网| 亚洲丶国产丶欧美一区二区三区| 美女又爽又黄视频毛茸茸| 亚洲综合第一页| 中文字幕视频一区二区在线有码| 免费观看日批视频| 国产精品久久久久久久久久99| 在线亚洲欧美日韩| 国产成人一区二区三区免费看| 欧美日产在线观看| 成人av网站在线观看| 国产一区二区三区久久久| 久久久久久久久久网| 中文字幕乱码日本亚洲一区二区| 国产日韩视频一区| 夜夜爽99久久国产综合精品女不卡| 久久精品成人一区二区三区| 成人av高清在线| 久热在线视频观看| 最好看的2019年中文视频| 亚洲男人天堂手机在线| 青青草国产成人av片免费| 欧美国产激情18| 欧美又粗又大又爽| av电影一区二区三区| 久久999免费视频| 精品亚洲男同gayvideo网站| 欧美视频三区在线播放| 精品第一国产综合精品aⅴ| www.日韩在线| 日韩男人的天堂| 在线免费看av的网站| 国产精品国产精品国产| 久久国产精品 国产精品| 国产98色在线|日韩| 丰满少妇xoxoxo视频| 无码国产精品一区二区免费式直播| 欧美精品一区二区视频| 欧美成人vps| 中文字幕无码日韩专区免费| 日韩激情久久| 91pron在线| 最近日韩中文字幕中文| 欧美一区二区三区系列电影| 91麻豆精品国产91久久久更新时间| 黄色片视频免费| 三级黄色在线视频| 激情四射综合网| 亚洲综合五月天婷婷丁香| 高清国产一区二区三区| 欧美成人性战久久| 美日韩精品免费视频| 神马影院我不卡午夜| 国产91精品青草社区| 欧美激情网友自拍| 日韩av电影中文字幕| 日本少妇高清视频| 国产精品夜夜夜爽阿娇| 亚洲二区自拍| 91香蕉亚洲精品| 日韩欧美中文字幕一区| 国产精品成人一区| 91在线短视频| 欧洲成人性视频| 国产精品久久久久久久久久久久| 国产精品久久久久久网站| 久久久午夜电影| 亚洲一线二线三线久久久| 女同久久另类69精品国产| 成人在线观看www| 国产亚洲色婷婷久久| 国产乱国产乱老熟300| www.四虎成人| 男人靠女人免费视频网站| 在线观看欧美亚洲| 成人三级视频在线播放| 欧美精品免费在线| 欧美成人欧美edvon| 亚洲成a人v欧美综合天堂下载 | 色av成人天堂桃色av| 欧美一区二区三区公司| 国产美女精品在线| 黄色污污视频软件| 首页综合国产亚洲丝袜| www.视频一区| 亚欧色一区w666天堂| 亚洲韩国精品一区| 欧美精品一二区| 国产亚洲欧美另类一区二区三区| 国产美女在线一区| 欧美久久久久久久久久久| 久久亚洲AV无码专区成人国产| 日韩国产小视频| 日本成人在线免费| 欧美伊久线香蕉线新在线| 国产激情999| 久久人人看视频| 国产精品免费电影| 国产天堂视频在线观看| 999视频在线观看| 91黄色小网站| 中国特黄一级片| 艹b视频在线观看| 亚洲18在线看污www麻豆| 欧美精品久久久久久久| 三区精品视频观看| 亚洲精品高清无码视频| 水蜜桃色314在线观看| www.97av.com| 中文字幕亚洲专区| 性刺激的欧美三级视频| 国产在线精品一区二区| 精品第一国产综合精品aⅴ| 久久综合免费视频| 麻豆视频成人| 亚洲热在线视频| 久久久久久久久艹| 粉嫩av亚洲一区二区图片| 综合欧美一区二区三区| 懂色av蜜臀av粉嫩av永久| 亚洲一区二区91| 天天操天天射天天舔| 欧美日韩一级二级| 国产精品永久免费观看| 丰满人妻一区二区三区53号| 四虎一区二区| 久久久久久亚洲精品不卡4k岛国| 午夜天堂在线视频| 姝姝窝人体www聚色窝| 精品视频一区三区九区| 亚洲精品成人三区| 老司机精品视频在线| 自拍av一区二区三区| 亚洲国产午夜伦理片大全在线观看网站| 中文字幕人妻精品一区| 91精品国产综合久久婷婷香蕉 | 欧美专区国产专区| 欧美精品vⅰdeose4hd| 国产区精品视频| 欧美一二三视频| 亚洲精品鲁一鲁一区二区三区 | 亚洲成人在线网站| 国产精品电影在线观看| 青娱乐国产盛宴| 国产精品高潮久久久久无| 日韩欧美国产不卡| 欧美午夜精品久久久久久蜜| 女教师淫辱の教室蜜臀av软件| 性一交一乱一乱一视频| 激情图片小说一区| 久久中文字幕国产| 免费看污片的网站| 亚洲男人的天堂av| 中文字幕乱码一区二区三区| 国产精品正在播放| 欧美中文字幕不卡| 国产成人综合久久| 久久久久久久久黄色| 91精品国产色综合久久不卡蜜臀| 在线视频91| 国产真人真事毛片| 中文字幕一区二区在线观看| 日韩免费在线看| 五月婷六月丁香| 国产欧美一区二区精品性| 成人激情电影一区二区| 国产91视觉| 亚洲天堂岛国片| 空姐吹箫视频大全| 2019最新中文字幕| 国产精品视频第一页| 免费超爽大片黄| 日韩中文字幕一区二区三区| 精品激情国产视频| 久久久久久久久艹| 日韩成人av影视| 日韩一级黄色av| 欧洲精品一区色| 亚洲中文字幕一区二区| 国产精品久久久久aaaa九色| 熟妇人妻系列aⅴ无码专区友真希| 99超碰麻豆| 免费黄色网址在线| 亚洲人成7777| 人妻精品无码一区二区三区| 日韩美女啊v在线免费观看| 国产高清精品一区二区| 成人久久精品人妻一区二区三区| 欧美日韩国产在线播放网站| 香蕉视频在线观看黄| 亚洲h精品动漫在线观看| 亚洲人成无码网站久久99热国产| 久久久久久一区二区| 91福利视频在线| 欧美午夜性生活| 亚洲成人av中文| 免费黄视频在线观看| 国产丝袜一区视频在线观看 | 欧美一级片免费在线观看| 久久在线视频精品| 一区二区三区资源| 成年人网站大全| 欧美日韩一区二区三区| 三级a三级三级三级a十八发禁止| 色婷婷精品久久二区二区蜜臀av| 爱爱免费小视频| 中文字幕亚洲第一| 少妇饥渴放荡91麻豆| 亚洲成人免费在线| 欧美一级免费播放| 亚洲综合一区二区三区| 超碰91在线播放| 欧美日韩裸体免费视频| 欧美精品99久久| 岛国一区二区在线观看| 亚洲a在线观看| 亚洲精品一区二区三区四区| 91精品国产高清久久久久久| 精东粉嫩av免费一区二区三区| 欧美女同在线观看| 欧美日韩国产片| 日本一本二本在线观看| 91福利区一区二区三区| 中文字幕网站在线观看| 久久艳片www.17c.com| 手机在线看片1024| 亚洲精品国产精品国自产观看浪潮| 久久久久久99| 国产欧美日韩卡一| 国产区二区三区| 日韩欧美三级在线| 精品人妻无码一区二区性色| 国产一区二区三区av在线| 一区二区欧美在线观看| 午夜精品免费看| 一区二区三区美女xx视频| 亚洲精品国产精品国自产| 成人黄色大片在线观看| 亚洲精品免费一区亚洲精品免费精品一区| 亚洲免费在线看| 一二三区视频在线观看| 亚洲第一国产精品| 中文字幕+乱码+中文| 日韩av观看网址| 136国产福利精品导航| avhd101老司机| 7777精品伊久久久大香线蕉语言| 亚洲啪啪综合av一区二区三区|