色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

十億參數(shù),一鍵瘦身!「模型減重」神器讓大模型狂掉3/4 | 最“in”大模型

“瘦身”依舊很驚艷

編者按:

“瘦身”后的大模型,表現(xiàn)依然可以很驚艷。

本文介紹了可提升大語言模型的訓(xùn)練后量化表現(xiàn)的增強型 SmoothQuant 技術(shù),說明了這項技術(shù)的用法,并證明了其在準(zhǔn)確率方面的優(yōu)勢。此方法已整合至英特爾? Neural Compressor[1] 中。

英特爾? Neural Compressor是一個包含量化、剪枝(稀疏性)、蒸餾(知識提煉)和神經(jīng)架構(gòu)搜索等多種常用模型壓縮技術(shù)的開源 Python 庫。

目前,諸如 TensorFlow、英特爾? Extension for TensorFlow[2]、PyTorch、英特爾? Extension for PyTorch[3]、ONNX Runtime 和 MXNet等主流框架,都能與之兼容。

英特爾? Neural Compressor 已經(jīng)支持多款英特爾? 架構(gòu)的硬件,比如英特爾? 至強? 可擴展處理器[4]、英特爾? 至強? CPU Max 系列[5]、英特爾? 數(shù)據(jù)中心 GPU Flex 系列[6]和英特爾? 數(shù)據(jù)中心 GPU Max 系列[7]。本文涉及的實驗基于第四代英特? 至強? 可擴展處理器[8]進行。

大語言模型

大語言模型 (Large Language Model, LLM) 需基于海量數(shù)據(jù)集進行訓(xùn)練,可能擁有數(shù)十億權(quán)重參數(shù)。

其先進的網(wǎng)絡(luò)結(jié)構(gòu)和龐大的參數(shù)量,使它們能夠很好地應(yīng)對自然語言本身的復(fù)雜性。

完成訓(xùn)練后的大語言模型,可針對各種下游的自然語言處理 (NLP) 和自然語言生成 (NLG) 任務(wù)進行調(diào)優(yōu),讓其更適合對話式聊天機器人(如 ChatGPT)、機器翻譯、文本分類、欺詐檢測和情感分析等任務(wù)場景。

大語言模型部署面臨的挑戰(zhàn)

大語言模型在執(zhí)行自然語言處理和自然語言生成任務(wù)方面表現(xiàn)出色,但其訓(xùn)練和部署頗為復(fù)雜,主要面臨以下挑戰(zhàn):

  • AI 與內(nèi)存墻瓶頸問題[9]:算力每兩年提高 3.1 倍,內(nèi)存帶寬卻只提高 1.4 倍;
  • 網(wǎng)絡(luò)帶寬挑戰(zhàn):訓(xùn)練大語言模型需要采用分布式系統(tǒng),這對網(wǎng)絡(luò)帶寬提出了較高要求;
  • 系統(tǒng)資源有限:訓(xùn)練后的模型往往會部署在算力和內(nèi)存資源均有限的系統(tǒng)上。

因此,采用訓(xùn)練后量化的方法來為大語言模型瘦身,對于實現(xiàn)低時延推理至關(guān)重要。

十億參數(shù),一鍵瘦身!「模型減重」神器讓大模型狂掉3/4 | 最“in”大模型

大語言模型的量化

量化是一種常見的壓縮操作,可以減少模型占用的內(nèi)存空間,提高推理性能。

采用量化方法可以降低大語言模型部署的難度。具體來說,量化是將浮點矩陣轉(zhuǎn)換為整數(shù)矩陣:

十億參數(shù),一鍵瘦身!「模型減重」神器讓大模型狂掉3/4 | 最“in”大模型

其中 X_fp32、S 和 Z 分別為輸入矩陣、比例因子和整數(shù)零點。

有關(guān)每通道 (per-channel) 量化策略雖然可能會減少量化損失,但不能用于激活值量化的原因,請參看 SmoothQuant 相關(guān)文檔[10]。

不過,激活值量化誤差損失卻是導(dǎo)致模型量化準(zhǔn)確率下降的重要因素。

為此,人們提出了很多方法來降低激活值量化損失,例如:SPIQ[11]、Outlier Suppression[12]和 SmoothQuant[13]。

這三種方法思路相似,即把激活值量化的難度轉(zhuǎn)移到權(quán)重量化上,只是三者在轉(zhuǎn)移難度的多少上有所不同。

增強型 SmoothQuant

SmoothQuant 引入了一個超參數(shù) α 作為平滑因子來計算每個通道的量化比例因子,并平衡激活值和權(quán)重的量化難度。

十億參數(shù),一鍵瘦身!「模型減重」神器讓大模型狂掉3/4 | 最“in”大模型

其中 j 是輸入通道索引。

十億參數(shù),一鍵瘦身!「模型減重」神器讓大模型狂掉3/4 | 最“in”大模型

對于 OPT 和 BLOOM 等大多數(shù)模型來說,α=0.5 是一個能夠較好實現(xiàn)權(quán)重和激活值量化難度分割的平衡值。模型的激活異常值越大,就越需要使用更大的 α 值來將更多的量化難度轉(zhuǎn)移到權(quán)重上。

原始的 SmoothQuant 旨在通過針對整個模型使用一個固定值 α 來分割權(quán)重和激活值的量化難度。

然而,由于激活異常值的分布不僅在不同模型之間存在差異,而且在同一模型的不同層之間也不盡相同。

因此,本文推薦使用英特爾? Neural Compressor 的自動調(diào)優(yōu)能力,逐層獲取最佳 α 值。

相關(guān)方法包括以下五個主要步驟(偽代碼如下所示):

  1. 通過特殊的回調(diào)函數(shù) register_forward_hook 捕獲 (hook) 模型各層的輸入和輸出值。
  2. 根據(jù)用戶定義的 α 范圍和步長生成一個 α 值列表。
  3. 根據(jù)給定的 α 值重新計算平滑因子并調(diào)整參數(shù)(權(quán)重值和激活值)。
  4. 對權(quán)重執(zhí)行每通道量化與反量化 (quantization_dequantization),對輸入值執(zhí)行每張量 (per-tensor) 量化與反量化,以預(yù)測與給定 α 值對應(yīng)的每層輸出值。
  5. 計算相對實際輸出值的均方損失,將調(diào)整后的參數(shù)恢復(fù)回來,并保存每層的最佳 α 值。
十億參數(shù),一鍵瘦身!「模型減重」神器讓大模型狂掉3/4 | 最“in”大模型

本文提出的方法支持用多個標(biāo)準(zhǔn)(如最小值、最大值和平均值)來確定 Transformer 塊的輸入層歸一化 (LayerNorm) 操作的 α 值。

實驗發(fā)現(xiàn),將 α 范圍設(shè)為 [0.3, 0.7],步長設(shè)為 0.05,對大多數(shù)模型來說都能達到很好的平衡。

這一方法有兩個顯著特點:一是全自動化,二是比原始方法支持的融合模式多。

下圖提供了在 BLOOM-1b7 模型上執(zhí)行 SmoothQuant α 值自動調(diào)優(yōu)的樣例代碼:

十億參數(shù),一鍵瘦身!「模型減重」神器讓大模型狂掉3/4 | 最“in”大模型

△啟用增強型 SmoothQuant 的樣例代碼

用戶只需傳遞一個模型名稱 (model_name) 和一個數(shù)據(jù)加載器。值得注意的是,模型分析主要依靠的是 Torch JIT。用戶可以在加載 Hugging Face[15]模型時將 torchscript 設(shè)置為 True,或?qū)?return_dict 設(shè)置為 False。

更多信息請參閱英特爾? Neural Compressor 文檔[15]。

結(jié)果

本文提出的增強型 SmoothQuant 的主要優(yōu)勢在于提高了準(zhǔn)確率。

經(jīng)過對多種主流大語言模型的評估,具備自動調(diào)優(yōu)能力的 INT8 SmoothQuant 最后一個詞元 (last-token) 的預(yù)測準(zhǔn)確率要高于原始 INT8 SmoothQuant 和 FP32 基線方法。詳見下圖:

十億參數(shù),一鍵瘦身!「模型減重」神器讓大模型狂掉3/4 | 最“in”大模型

△FP32基線方法、INT8(啟用和不啟用 SmoothQuant)以及 INT8(啟用本文提出的增強型 SmoothQuant)的準(zhǔn)確率對比

從上圖可以看出,在 OPT-1.3b 和 BLOOM-1b7 模型上,本文提出的增強型 SmoothQuant 的準(zhǔn)確率比默認(rèn)的 SmoothQuant 分別高 5.4% 和 1.6%。

量化后的模型也縮小到 FP32 模型的四分之一,大大減少了內(nèi)存占用空間,從而有效地提升大模型在英特爾? 平臺上的推理性能。

更全面的結(jié)果請見 GitHub 存儲庫[16]。同時,也歡迎您創(chuàng)建拉取請求或就 GitHub 問題[17]發(fā)表評論。期待聽到您的反饋意見和建議。

作者:

英特爾公司人工智能資深架構(gòu)師沈海豪、英特爾公司人工智能資深軟件工程師程文華、英特爾公司人工智能軟件工程師陸崟彤、何欣、郭恒、王暢、王夢妮,他們都在從事模型量化及壓縮的研究與優(yōu)化工作。

參考鏈接:

[1]英特爾? Neural Compressor:

https://www.intel.cn/content/www/cn/zh/developer/tools/oneapi/neural-compressor.html

[2]英特爾? Extension for TensorFlow:

https://www.intel.cn/content/www/cn/zh/developer/tools/oneapi/optimization-for-tensorflow.html

[3]英特爾? Extension for PyTorch:

https://www.intel.cn/content/www/cn/zh/developer/tools/oneapi/optimization-for-pytorch.html

[4]英特爾? 至強? 可擴展處理器:

https://www.intel.cn/content/www/cn/zh/products/details/processors/xeon/scalable.html

[5]英特爾? 至強? CPU Max 系列:

https://www.intel.cn/content/www/cn/zh/products/details/processors/xeon/max-series.html

[6]英特爾? 數(shù)據(jù)中心 GPU Flex 系列:

https://www.intel.cn/content/www/cn/zh/products/details/discrete-gpus/data-center-gpu/flex-series.html

[7]英特爾? 數(shù)據(jù)中心 GPU Max 系列:

https://www.intel.cn/content/www/cn/zh/products/details/discrete-gpus/data-center-gpu/max-series.html

[8]第四代英特? 至強? 可擴展處理器:

https://www.intel.cn/content/www/cn/zh/events/accelerate-with-xeon.html

[9]AI 與內(nèi)存墻:

https://medium.com/riselab/ai-and-memory-wall-2cb4265cb0b8

[10]SmoothQuant 相關(guān)文檔:

https://github.com/intel/neural-compressor/blob/master/docs/source/smooth_quant.md

[11]SPIQ:

https://arxiv.org/abs/2203.14642

[12]Outlier Suppression:

https://arxiv.org/abs/2209.13325

[13]SmoothQuant:

https://arxiv.org/abs/2211.10438

[14]Hugging Face 模型:

https://huggingface.co/models

[15]英特爾? Neural Compressor 文檔:

https://github.com/intel/neural-compressor/blob/master/docs/source/smooth_quant.md

[16]GitHub 存儲庫:

https://github.com/intel/neural-compressor/blob/master/docs/source/smooth_quant.md

[17]GitHub 問題:

https://github.com/intel/neural-compressor/issues

版權(quán)所有,未經(jīng)授權(quán)不得以任何形式轉(zhuǎn)載及使用,違者必究。
久久免费观看视频| 朝桐光av在线一区二区三区| 校园春色 亚洲| 欧美激情在线看| 欧美激情视频播放| 美女诱惑一区| a天堂中文字幕| 91嫩草丨国产丨精品| 天堂在线中文视频| 成人在线视频网站| 亚洲xxxx3d| 国产精品久久久久久亚洲毛片| 国产精品视频一区二区三区不卡| 欧美视频中文字幕| 日韩亚洲视频| 久久成人av少妇免费| 性日韩欧美在线视频| 香蕉视频在线网址| 久久综合狠狠综合久久综青草| 日韩欧美国产激情| 日韩国产精品91| 免费黄在线观看| 妞干网在线播放| 国内久久久精品| 国产精品免费在线播放| 一本久久a久久精品vr综合 | 日韩区国产区| 中文成人av在线| 99精品中文字幕| 久久99久久99精品| 久久精品一区二区三区不卡牛牛| 久久爱www久久做| 亚洲欧洲一区二区三区久久| 色综合久久av| 手机看片一区二区三区| 亚洲天堂久久av| av在线网站观看| 久久精品国产亚洲av香蕉 | aaaaaa毛片| 一本色道久久综合狠狠躁的推荐| 8x8ⅹ国产精品一区二区二区| 国产真实夫妇交换视频| 久久久久久久久久久久久女国产乱| 亚洲国产精品久久| 日本福利视频导航| 一级黄色片免费| 欧美日韩免费一区二区三区| 8x拔播拔播x8国产精品| 日韩av影视大全| 国产99久一区二区三区a片 | 亚洲欧洲午夜一线一品| 91深夜福利视频| 日本一区二区三区视频在线播放| 国产原创中文在线观看| 公侵犯人妻一区二区三区| 1000精品久久久久久久久| 欧美色成人综合| 丁香色欲久久久久久综合网| 2017欧美狠狠色| 午夜精产品一区二区在线观看的| 在线免费视频a| 日韩电影中文字幕| 日韩电影在线观看中文字幕 | 在线观看日本中文字幕| 中文字幕视频二区| 91丝袜美腿高跟国产极品老师| 久久国产在线观看| 欧美激情久久久久| 青草热久免费精品视频| 久久久天堂国产精品| 国产麻豆日韩欧美久久| 国产乱肥老妇国产一区二| 免费一级a毛片夜夜看| 91在线小视频| 91精品国产免费| 91精品国产一区二区三区动漫 | a级高清视频欧美日韩| 欧美撒尿777hd撒尿| zjzjzjzjzj亚洲女人| 国产69精品久久99不卡| 欧美极度另类性三渗透| 欧美性视频在线播放| 久久综合色天天久久综合图片| 国产精品18久久久久久久久久久久 | 欧美日韩中文视频| 亚洲成人福利片| 欧美一区二区三区免费| 97在线视频免费看| 国产高清精品一区二区三区| 91精品久久久久久蜜桃| 国产欧美韩日| 日韩精品视频久久| 欧美色欧美亚洲另类七区| 91在线免费看片| 精品国产无码在线| 日韩精品视频在线观看网址| 日韩视频在线观看一区二区| 久久国产精品免费观看| 丰满人妻一区二区三区免费视频| 亚洲丁香久久久| www.欧美日本| 久久99精品久久久| 久久九九国产精品怡红院| 亚洲精品一二三四| 91麻豆123| 国产欧美在线看| 亚洲伦理一区二区三区| 亚洲一区二区在线观看视频| 国产精品手机在线| 午夜爽爽爽男女免费观看| 久久一二三四| 亚洲精品狠狠操| 女人和拘做爰正片视频| 久久精品五月| 日本一区二区久久| 国产亚洲激情在线| 亚洲欧美一区二区三区四区| 欧美大波大乳巨大乳| 国产精品无码免费播放| 亚洲性视频网址| 最新在线黄色网址| 国产aⅴ综合色| 亚洲激情在线观看视频免费| 亚洲欧美日韩精品综合在线观看| 91中文字幕永久在线| 欧美成人aaa片一区国产精品| 国产成人精品av在线观| 中文字幕一区二区三区蜜月| 亚洲综合久久久久| 欧美精品日韩三级| 一区二区三区四区欧美日韩| 三上悠亚久久精品| 麻豆成人免费视频| 一区二区三区日韩| 亚洲精品视频免费| 欧美一区在线直播| 国产高清精品软男同| 日韩精品手机在线观看| 黄色一级大片在线观看| 中文字幕永久免费| 久久亚洲AV无码| 国产一区二区免费看| 2023国产精品| 91精品福利视频| 九九热在线精品视频| 亚洲 高清 成人 动漫| 老司机午夜免费精品视频| 日韩一区二区三免费高清| gogogo高清免费观看在线视频| 欧美国产精品一区二区| 日本美女视频网站| 911国产网站尤物在线观看| 日本视频免费一区| 中文精品在线观看| 国产精品久久久久秋霞鲁丝| 国产成人精品av久久| 中文字幕在线成人| 久久久综合激的五月天| 九九热免费在线观看| 久久国产精品久久久久| 97se亚洲国产综合自在线观| 在线观看的毛片| 国产精品美女一区二区在线观看| 真实国产乱子伦对白在线| 91亚洲精品一区二区| 人人妻人人澡人人爽精品日本| 国产精品日本一区二区| 黄色小视频免费观看| 那种视频在线观看| 亚洲性av网站| 黄网站免费久久| 中文字幕日韩精品一区二区| 久久久久久亚洲综合影院红桃 | 国产成人在线色| 永久免费精品视频网站| 国产精品久久久| 午夜国产精品影院在线观看| 久久精品国产成人av| 国内一区二区在线视频观看| 亚洲综合在线免费观看| 国产高清999| 99在线观看视频网站| 色94色欧美sute亚洲线路一ni | 丁香花免费高清完整在线播放| 一区二区日本伦理| 欧美精品久久一区| 日本性生活一级片| 久久久亚洲国产天美传媒修理工| 欧美日韩中文一区| 日韩高清中文字幕一区| 国产v亚洲v天堂无码久久久| 精品视频www| 久久亚洲图片| 久久久久久久久久久久久久一区| 精品国产91洋老外米糕| 亚洲精品久久久久久国产精华液| 亚洲久草在线视频| 欧美国产亚洲另类动漫| 午夜精品福利一区二区三区蜜桃| 国产精品视频你懂的| 国产美女精品一区二区三区| 国产性xxxx高清| 一区二区三区在线观看www| 日韩在线精品一区| 污视频网站在线播放| 内射毛片内射国产夫妻| 青青草久久网络| 欧美亚洲在线观看| 精品视频第一区| 久久综合伊人77777麻豆| 黄在线观看网站| 国产精品久久av| 日韩欧美一区中文| 怡红院av一区二区三区| 亚洲免费不卡视频| 日韩成年人视频| 正在播放国产精品| 国产精品丝袜白浆摸在线| 亚洲va欧美va天堂v国产综合| 日本在线不卡一区二区| 午夜精品久久久久久久久久久久| 久久久国产精华| 欧美午夜激情影院| 日韩激情免费视频| 在线成人av电影| 国产日韩欧美在线播放| 日韩av在线一区二区| 亚洲国产高清在线观看视频| 国产寡妇亲子伦一区二区| 国产视频亚洲色图| 日韩一区二区电影| 九九视频这里只有精品| 国产日韩欧美中文| 国产在线观看91精品一区| 欧美成人在线免费| 欧美视频免费在线| 国产高清久久久| 一本到在线视频| 亚洲天堂一区在线| 国产男人搡女人免费视频| 手机在线看福利| 日本久久久久久久久久久| 欧美日韩中文字幕| 日韩欧美成人精品| 欧美国产1区2区| 中文区中文字幕免费看| 久久久精品99| 男女性高潮免费网站| 国产一级特黄视频| 国产大陆精品国产| 欧美一级一区二区| 91最新在线免费观看| 亚洲巨乳在线观看| 日本高清免费观看| 好男人www社区| 污污的网站18| 亚洲香蕉成视频在线观看| 精品国免费一区二区三区| 欧美日韩午夜在线视频| 亚洲加勒比久久88色综合| 日韩大片免费观看视频播放| 国产成人午夜99999| 三上悠亚在线观看视频| 午夜两性免费视频| 日韩视频在线播放| 成人国内精品久久久久一区| 鲁丝一区二区三区免费| 成人免费视频91| 日韩精品在线中文字幕| 综合视频在线观看| 色一情一区二区| 九九热视频在线免费观看| 美洲天堂一区二卡三卡四卡视频| 一本色道久久综合亚洲aⅴ蜜桃 | 成人免费看片载| 一区二区三区国产福利| 国产精品美女无圣光视频| 亚洲视频在线播放| 国产美女精品免费电影| 亚洲欧洲一区二区福利| 精品999在线观看| 欧美男人的天堂| 51自拍视频在线观看| 久久久久99精品成人| 亚洲天堂视频在线| 高清不卡在线观看av| 亚洲精品水蜜桃| 一区视频在线播放| 亚洲男人的天堂在线观看| 欧美日本在线一区| 九九热这里只有精品6| 国产精品视频网址| 91中文字幕在线| 欧美午夜欧美| 亚洲一区在线不卡| 久久久久久久久久97| 欧美韩国日本不卡| 国外视频精品毛片| 国产精品mp4| 久久久久se| 1314成人网| 国产黄色片免费| 亚洲日本在线播放| 污污视频在线观看网站| 亚洲三级在线免费观看| 最新中文字幕亚洲| 天天操天天爱天天爽| 欧美不卡视频在线观看| 亚洲免费观看在线视频| 97精品久久久中文字幕免费| 人体精品一二三区| 精品无人乱码一区二区三区的优势| 天堂网成人在线| 中文字幕在线观看你懂的| 一区二区三区欧美久久| 亚洲黄页视频免费观看| 国产精品自拍偷拍| 日韩日韩日韩日韩日韩| 人妻av无码一区二区三区| 亚洲精品国产一区二区精华液 | 国偷自产av一区二区三区麻豆| 中国一区二区视频| 国产一区福利在线| 视频一区中文字幕| 精品一区二区三区在线播放| 国产成人免费视频网站高清观看视频 | 欧美日韩中文在线视频| 久久久久久久高清| 三上悠亚影音先锋| 一级黄色大片视频| 欧美视频xxx| 国产电影精品久久禁18| www.久久久久久久久| 亚洲观看高清完整版在线观看 | 亚洲精品国产欧美| 午夜精品久久17c| 久久精品国产第一区二区三区最新章节 | 国产精品一区而去| 丁香婷婷激情网| 在线国产视频一区| 国产99久久久| 国产一区二区视频在线播放| 亚洲欧美国产毛片在线| 欧美一区二区性放荡片| 欧美精品在线播放| 欧美日韩国产三区| 亚洲妇熟xx妇色黄蜜桃| 亚洲天堂一区在线观看| 久久国产麻豆精品| 欧美色xxxx| 欧美猛男性生活免费| 久久涩涩网站| 黄色片子免费看| 超碰中文字幕在线| 三级在线观看一区二区| 欧美日韩人人澡狠狠躁视频| 欧美第一黄网免费网站| 含羞草久久爱69一区| 国产又猛又黄的视频| 日韩欧美大片在线观看| 久久精品国产99国产| 五月综合激情日本mⅴ| 992tv成人免费影院| 国产小视频免费| 91tv国产成人福利| 中文字幕中文字幕在线一区| 午夜精品视频在线| 一区二区xxx| 亚洲熟女综合色一区二区三区| 91色乱码一区二区三区| 综合网日日天干夜夜久久| 免费极品av一视觉盛宴| 日韩在线视频不卡| 国产三级久久久| 欧美成人精品一区二区| 日韩欧美在线免费观看视频| 无码免费一区二区三区| 亚洲一区二区三区小说| 国产成人精品在线视频| 国产精品二区视频| 精品亚洲国内自在自线福利| 日韩经典中文字幕| 草草草视频在线观看| 夜夜狠狠擅视频| 欧美日韩一区二区电影| 日本精品免费| 中文字幕在线2019| 欧美日韩国产综合视频在线观看 | av观看久久| 国产精品21p| 色菇凉天天综合网| 精品一区久久久久久| 一区二区三区日| 欧美一区二区免费| 妺妺窝人体色www看人体| av资源免费看| 日韩欧美国产一区在线观看| 亚洲一区二区在线看| 蜜桃视频久久一区免费观看入口| 欧美一区二区大片| 黑人糟蹋人妻hd中文字幕| 国产不卡在线播放| 国产成一区二区| 亚洲 欧美 日韩 在线| 亚洲电影中文字幕| 人妻精油按摩bd高清中文字幕| 久久久久久99精品| 国产精品午夜国产小视频| 日韩精品手机在线| 欧美tickling挠脚心丨vk|