色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

十億參數,一鍵瘦身!「模型減重」神器讓大模型狂掉3/4 | 最“in”大模型

“瘦身”依舊很驚艷

編者按:

“瘦身”后的大模型,表現依然可以很驚艷。

本文介紹了可提升大語言模型的訓練后量化表現的增強型 SmoothQuant 技術,說明了這項技術的用法,并證明了其在準確率方面的優勢。此方法已整合至英特爾? Neural Compressor[1] 中。

英特爾? Neural Compressor是一個包含量化、剪枝(稀疏性)、蒸餾(知識提煉)和神經架構搜索等多種常用模型壓縮技術的開源 Python 庫。

目前,諸如 TensorFlow、英特爾? Extension for TensorFlow[2]、PyTorch、英特爾? Extension for PyTorch[3]、ONNX Runtime 和 MXNet等主流框架,都能與之兼容。

英特爾? Neural Compressor 已經支持多款英特爾? 架構的硬件,比如英特爾? 至強? 可擴展處理器[4]、英特爾? 至強? CPU Max 系列[5]、英特爾? 數據中心 GPU Flex 系列[6]和英特爾? 數據中心 GPU Max 系列[7]。本文涉及的實驗基于第四代英特? 至強? 可擴展處理器[8]進行。

大語言模型

大語言模型 (Large Language Model, LLM) 需基于海量數據集進行訓練,可能擁有數十億權重參數。

其先進的網絡結構和龐大的參數量,使它們能夠很好地應對自然語言本身的復雜性。

完成訓練后的大語言模型,可針對各種下游的自然語言處理 (NLP) 和自然語言生成 (NLG) 任務進行調優,讓其更適合對話式聊天機器人(如 ChatGPT)、機器翻譯、文本分類、欺詐檢測和情感分析等任務場景。

大語言模型部署面臨的挑戰

大語言模型在執行自然語言處理和自然語言生成任務方面表現出色,但其訓練和部署頗為復雜,主要面臨以下挑戰:

  • AI 與內存墻瓶頸問題[9]:算力每兩年提高 3.1 倍,內存帶寬卻只提高 1.4 倍;
  • 網絡帶寬挑戰:訓練大語言模型需要采用分布式系統,這對網絡帶寬提出了較高要求;
  • 系統資源有限:訓練后的模型往往會部署在算力和內存資源均有限的系統上。

因此,采用訓練后量化的方法來為大語言模型瘦身,對于實現低時延推理至關重要。

十億參數,一鍵瘦身!「模型減重」神器讓大模型狂掉3/4 | 最“in”大模型

大語言模型的量化

量化是一種常見的壓縮操作,可以減少模型占用的內存空間,提高推理性能。

采用量化方法可以降低大語言模型部署的難度。具體來說,量化是將浮點矩陣轉換為整數矩陣:

十億參數,一鍵瘦身!「模型減重」神器讓大模型狂掉3/4 | 最“in”大模型

其中 X_fp32、S 和 Z 分別為輸入矩陣、比例因子和整數零點。

有關每通道 (per-channel) 量化策略雖然可能會減少量化損失,但不能用于激活值量化的原因,請參看 SmoothQuant 相關文檔[10]。

不過,激活值量化誤差損失卻是導致模型量化準確率下降的重要因素。

為此,人們提出了很多方法來降低激活值量化損失,例如:SPIQ[11]、Outlier Suppression[12]和 SmoothQuant[13]。

這三種方法思路相似,即把激活值量化的難度轉移到權重量化上,只是三者在轉移難度的多少上有所不同。

增強型 SmoothQuant

SmoothQuant 引入了一個超參數 α 作為平滑因子來計算每個通道的量化比例因子,并平衡激活值和權重的量化難度。

十億參數,一鍵瘦身!「模型減重」神器讓大模型狂掉3/4 | 最“in”大模型

其中 j 是輸入通道索引。

十億參數,一鍵瘦身!「模型減重」神器讓大模型狂掉3/4 | 最“in”大模型

對于 OPT 和 BLOOM 等大多數模型來說,α=0.5 是一個能夠較好實現權重和激活值量化難度分割的平衡值。模型的激活異常值越大,就越需要使用更大的 α 值來將更多的量化難度轉移到權重上。

原始的 SmoothQuant 旨在通過針對整個模型使用一個固定值 α 來分割權重和激活值的量化難度。

然而,由于激活異常值的分布不僅在不同模型之間存在差異,而且在同一模型的不同層之間也不盡相同。

因此,本文推薦使用英特爾? Neural Compressor 的自動調優能力,逐層獲取最佳 α 值。

相關方法包括以下五個主要步驟(偽代碼如下所示):

  1. 通過特殊的回調函數 register_forward_hook 捕獲 (hook) 模型各層的輸入和輸出值。
  2. 根據用戶定義的 α 范圍和步長生成一個 α 值列表。
  3. 根據給定的 α 值重新計算平滑因子并調整參數(權重值和激活值)。
  4. 對權重執行每通道量化與反量化 (quantization_dequantization),對輸入值執行每張量 (per-tensor) 量化與反量化,以預測與給定 α 值對應的每層輸出值。
  5. 計算相對實際輸出值的均方損失,將調整后的參數恢復回來,并保存每層的最佳 α 值。
十億參數,一鍵瘦身!「模型減重」神器讓大模型狂掉3/4 | 最“in”大模型

本文提出的方法支持用多個標準(如最小值、最大值和平均值)來確定 Transformer 塊的輸入層歸一化 (LayerNorm) 操作的 α 值。

實驗發現,將 α 范圍設為 [0.3, 0.7],步長設為 0.05,對大多數模型來說都能達到很好的平衡。

這一方法有兩個顯著特點:一是全自動化,二是比原始方法支持的融合模式多。

下圖提供了在 BLOOM-1b7 模型上執行 SmoothQuant α 值自動調優的樣例代碼:

十億參數,一鍵瘦身!「模型減重」神器讓大模型狂掉3/4 | 最“in”大模型

△啟用增強型 SmoothQuant 的樣例代碼

用戶只需傳遞一個模型名稱 (model_name) 和一個數據加載器。值得注意的是,模型分析主要依靠的是 Torch JIT。用戶可以在加載 Hugging Face[15]模型時將 torchscript 設置為 True,或將 return_dict 設置為 False。

更多信息請參閱英特爾? Neural Compressor 文檔[15]。

結果

本文提出的增強型 SmoothQuant 的主要優勢在于提高了準確率。

經過對多種主流大語言模型的評估,具備自動調優能力的 INT8 SmoothQuant 最后一個詞元 (last-token) 的預測準確率要高于原始 INT8 SmoothQuant 和 FP32 基線方法。詳見下圖:

十億參數,一鍵瘦身!「模型減重」神器讓大模型狂掉3/4 | 最“in”大模型

△FP32基線方法、INT8(啟用和不啟用 SmoothQuant)以及 INT8(啟用本文提出的增強型 SmoothQuant)的準確率對比

從上圖可以看出,在 OPT-1.3b 和 BLOOM-1b7 模型上,本文提出的增強型 SmoothQuant 的準確率比默認的 SmoothQuant 分別高 5.4% 和 1.6%。

量化后的模型也縮小到 FP32 模型的四分之一,大大減少了內存占用空間,從而有效地提升大模型在英特爾? 平臺上的推理性能。

更全面的結果請見 GitHub 存儲庫[16]。同時,也歡迎您創建拉取請求或就 GitHub 問題[17]發表評論。期待聽到您的反饋意見和建議。

作者:

英特爾公司人工智能資深架構師沈海豪、英特爾公司人工智能資深軟件工程師程文華、英特爾公司人工智能軟件工程師陸崟彤、何欣、郭恒、王暢、王夢妮,他們都在從事模型量化及壓縮的研究與優化工作。

參考鏈接:

[1]英特爾? Neural Compressor:

https://www.intel.cn/content/www/cn/zh/developer/tools/oneapi/neural-compressor.html

[2]英特爾? Extension for TensorFlow:

https://www.intel.cn/content/www/cn/zh/developer/tools/oneapi/optimization-for-tensorflow.html

[3]英特爾? Extension for PyTorch:

https://www.intel.cn/content/www/cn/zh/developer/tools/oneapi/optimization-for-pytorch.html

[4]英特爾? 至強? 可擴展處理器:

https://www.intel.cn/content/www/cn/zh/products/details/processors/xeon/scalable.html

[5]英特爾? 至強? CPU Max 系列:

https://www.intel.cn/content/www/cn/zh/products/details/processors/xeon/max-series.html

[6]英特爾? 數據中心 GPU Flex 系列:

https://www.intel.cn/content/www/cn/zh/products/details/discrete-gpus/data-center-gpu/flex-series.html

[7]英特爾? 數據中心 GPU Max 系列:

https://www.intel.cn/content/www/cn/zh/products/details/discrete-gpus/data-center-gpu/max-series.html

[8]第四代英特? 至強? 可擴展處理器:

https://www.intel.cn/content/www/cn/zh/events/accelerate-with-xeon.html

[9]AI 與內存墻:

https://medium.com/riselab/ai-and-memory-wall-2cb4265cb0b8

[10]SmoothQuant 相關文檔:

https://github.com/intel/neural-compressor/blob/master/docs/source/smooth_quant.md

[11]SPIQ:

https://arxiv.org/abs/2203.14642

[12]Outlier Suppression:

https://arxiv.org/abs/2209.13325

[13]SmoothQuant:

https://arxiv.org/abs/2211.10438

[14]Hugging Face 模型:

https://huggingface.co/models

[15]英特爾? Neural Compressor 文檔:

https://github.com/intel/neural-compressor/blob/master/docs/source/smooth_quant.md

[16]GitHub 存儲庫:

https://github.com/intel/neural-compressor/blob/master/docs/source/smooth_quant.md

[17]GitHub 問題:

https://github.com/intel/neural-compressor/issues

版權所有,未經授權不得以任何形式轉載及使用,違者必究。
欧美精品一二三四区| 欧美乱妇高清无乱码| 国产二级一片内射视频播放| 成人性生交大片免费看小说| 亚洲线精品一区二区三区| 在线观看免费国产视频| 精品久久久久久综合日本 | 性生交大片免费全黄| 国产精品久久久久77777| 久久精品一区二区三区中文字幕| 久久五月天婷婷| 欧美日韩精品一区二区三区| 91麻豆精品91久久久久久清纯| 欧美mv日韩mv国产网站| 日韩在线视频国产| 日本欧美国产在线| 国产一级特黄a大片99| 相泽南亚洲一区二区在线播放| 91嫩草国产丨精品入口麻豆| 国内外免费激情视频| 怡红院一区二区| 亚洲色图综合区| 国产精品热久久| 久久99精品国产麻豆不卡| 久久嫩草精品久久久精品一| 五月天婷婷综合| 精品乱人伦一区二区三区| 久久综合五月天| 亚洲一区久久久| 一本—道久久a久久精品蜜桃| 久久久久久久久久久久久久国产| 黄色录像a级片| 老熟妇仑乱一区二区av| 久久精品99国产精品| 国产精品国产a| 日韩一卡二卡三卡四卡| 97高清免费视频| 免费观看国产成人| 中文字幕第38页| 欧美在线视频第一页| 欧美一级淫片免费视频魅影视频| 97se亚洲国产综合在线| 91成人网在线| 欧美激情乱人伦一区| 久久久99国产精品免费| 最新av免费在线观看| 国产精品99精品无码视| 免费一级片91| 精品国产91久久久久久| 精品国内产的精品视频在线观看| 国产经典一区二区三区| 在线观看免费成人av| 日本特黄一级片| 国产一区二区三区在线观看免费视频 | 亚洲一区二区在线看| 欧美午夜精品理论片| 久久久久99精品成人片三人毛片| 国产在线国偷精品免费看| 亚洲最快最全在线视频| 色老头在线视频| 欧美乱偷一区二区三区在线| 亚洲综合av影视| 美女999久久久精品视频| 日本精品免费观看| 欧美一二三区在线| eeuss中文字幕| 欧美丰满少妇xxxbbb| 国产精品系列视频| av在线网站观看| 日韩精品一区二区视频| 国产精品一级在线| 国产亚洲短视频| 亚洲免费在线播放| 五月综合激情婷婷六月色窝| 一本在线高清不卡dvd| 亚洲成人精品一区| 中文字幕精品三区| 亚洲一区二区av电影| 一区二区中文字幕在线| 亚洲色图.com| 国产欧美日韩亚州综合| 91精品国产综合久久婷婷香蕉| 午夜成人在线视频| 欧洲中文字幕国产精品| 欧美午夜aaaaaa免费视频| 欧美日韩 一区二区三区| 久久久久久久久岛国免费| 亚洲色图国产精品| 国产啪精品视频| 日韩风俗一区 二区| 久久精品国产免费| 网站黄在线观看| 国产伦精品一区二区三区免费| 91视频91自| 欧洲一区在线电影| 欧美成人免费一级人片100| 日韩av电影院| 少妇精品久久久久久久久久| 小毛片在线观看| 亚洲熟女乱色一区二区三区久久久| 国产一区二区免费在线| 国产精品欧美久久久久一区二区| 亚洲AV无码国产成人久久| 日本sm极度另类视频| 久久久com| 亚洲精品女人久久久| 国产aaaaaaaaa| 青青草成人av| 国产成人精品一区二区三区四区| 精品一区二区久久久| 少妇愉情理伦三级| 欧美一级片在线视频| 欧美熟妇另类久久久久久多毛| 国产精品午夜一区二区欲梦| 亚洲久久久久久久久久| 国产精品久久久久久户外露出| 日韩高清在线电影| 日韩精彩视频在线观看| 久久久久性色av无码一区二区| 国产精品久久国产| 亚洲va欧美va国产综合剧情| 亚洲欧美制服另类日韩| 91国偷自产一区二区使用方法| 亚洲av成人无码网天堂| 国产97免费视频| 欧美,日韩,国产在线| 国产av第一区| 日韩视频免费在线播放| 久久精品国产一区二区三区日韩| 精品一区久久久久久| 国产美女视频免费看| 欧美黄色免费在线观看| 欧美一级做a爰片免费视频| 中国一级片黄色一级片黄| 丝袜a∨在线一区二区三区不卡| 老司机精品视频在线| 日韩在线观看一区二区| 国产成人精品av在线观| 91毛片在线观看| 69堂成人精品免费视频| 国产不卡视频在线观看| 欧美性淫爽ww久久久久无| 成人午夜免费在线视频| 国产一区二区女| 欧美一级bbbbb性bbbb喷潮片| 一级片视频免费看| 国产午夜亚洲精品午夜鲁丝片| αv一区二区三区| 国产chinasex对白videos麻豆| 中文字幕在线国产精品| 九九免费精品视频| 国产亚洲精品久久久久久牛牛| 午夜在线观看一区| 色婷婷综合在线| 久久久久久久久久久久久久久久av| 国产自产一区二区| 毛片精品免费在线观看| 成人毛片视频免费看| 性一交一乱一伧国产女士spa| 日韩美女视频一区二区在线观看| 国产成人在线视频观看| 成人丝袜高跟foot| 日韩网址在线观看| 亚洲精品1区2区3区| 国产精品久久久久久久久免费樱桃| www.cao超碰| 久久欧美在线电影| 久久午夜羞羞影院免费观看| 色综合久久88色综合天天提莫| 轻轻草成人在线| 欧美精品aaa| 日韩欧美国产另类| 国产伦精品一区二区三区| 白丝女仆被免费网站| 亚洲视频免费在线观看| 一区二区三区在线视频111| 亚洲精品久久久久久久久久久| 国产无遮无挡120秒| 欧美成人激情图片网| 日韩精品91亚洲二区在线观看| 欧美体内she精视频| 亚洲综合在线一区二区| 一区二区三区黄色| 久久尤物电影视频在线观看| 九九热最新视频| 污版视频在线观看| 亚洲xxxxx电影| 亚洲欧美电影一区二区| 久久精品国产亚洲av久| 欧美性69xxxx肥| 午夜69成人做爰视频| 欧美交受高潮1| 亚洲h视频在线观看| 欧美一区二区视频在线观看 | 一级黄色大片免费观看| 成人免费看片网站| 久久午夜免费电影| 久久国产高清视频| 成人在线资源网址| 99在线视频免费| 老汉色影院首页| 中文字幕亚洲一区| 成人免费视频视频在线观看免费 | 国产无遮挡猛进猛出免费软件| 日韩精品一区二区三区在线| 污污免费在线观看| 色综合亚洲精品激情狠狠| 免费成人在线影院| 777久久精品一区二区三区无码| 国产精品成人免费在线| 国产av天堂无码一区二区三区| 精品网站在线看| 欧美一区二区美女| 国产一区999| 亚洲熟妇一区二区三区| 精品国产sm最大网站| 奇米影视第四色777| 免费的av网站| 无码少妇一区二区三区芒果| 亚洲一区二区三区在线观看视频| 亚洲欧美日韩精品在线| 99亚洲精品视频| 99热在线国产| 国产精品久久久久秋霞鲁丝| 亚洲一区二区三区四区在线| 欧美另类视频在线观看| 成人毛片100部免费看| 日韩在线观看免费高清| 国产视频一区在线观看| av黄色一级片| 91超碰中文字幕久久精品| 国产精品一卡二| www.天堂在线| 日韩在线中文字幕视频| 99re在线观看| 日韩色av导航| 精品sm在线观看| 久久精品男人的天堂| 成人在线免费高清视频| 国产伦精品一区二区三区视频孕妇 | 91国产视频在线| 国产69精品99久久久久久宅男| 欧美成人精品影院| 色婷婷久久久亚洲一区二区三区| 性一交一乱一透一a级| aaa一级黄色片| 久久久婷婷一区二区三区不卡| 不卡av电影在线观看| 日韩欧美国产网站| 国产伦精品一区二区三区免费| 在线播放 亚洲| 欧美一区二区视频在线观看2020| 国产av无码专区亚洲av麻豆| 成年人看的毛片| 日韩中文综合网| 日韩午夜三级在线| 在线播放日韩导航| 亚洲电影第三页| 日韩在线观看一区二区| 精品黑人一区二区三区在线观看| 一道本无吗一区| 国产精品一区在线观看你懂的| 免费无遮挡无码永久在线观看视频 | 日本三级小视频| 中文字幕一区二区三区人妻| 日本丰满大乳奶| 亚洲 日韩 国产第一区| 欧美黄色片免费观看| 亚洲欧美日韩爽爽影院| 日韩三级电影网址| 成人黄色免费视频| 制服下的诱惑暮生| 国产一区二区三区高清| 一区二区三区四区在线观看视频| 国产精品素人视频| 国产成人精品免费在线| 国产精品99久久久久久宅男| 国产精品原创巨作av| 久久中文在线| 免费观看久久久4p| 成人毛片在线观看| 欧美成人高清电影在线| 国产精品视频99| 老汉色影院首页| 天堂资源在线视频| 蜜桃av噜噜一区| 亚洲欧美区自拍先锋| 国产欧美日韩精品一区| 国产日韩欧美一区二区三区乱码 | 国产制服丝袜一区| 久久蜜桃精品| 国模娜娜一区二区三区| 99久久99久久免费精品蜜臀| 久草视频中文在线| 人妻丰满熟妇aⅴ无码| 波多野结衣家庭教师视频| 日本不卡二区高清三区| 国产精品美女在线观看| 久久久久久久成人| 国产一区国产精品| 香蕉视频在线观看黄| 九热视频在线观看| 国产ts丝袜人妖系列视频| 波多野结衣电车| 久久综合九色| 一级做a爱片久久| 欧美福利小视频| 视频二区一区| 日韩中文字幕免费在线| 国产一区二区在线免费播放| www.17c.com喷水少妇| 久热这里有精品| 国产男女猛烈无遮挡| 久久久久久自在自线| 国产午夜一区二区三区| 四虎免费在线观看| 老牛国产精品一区的观看方式| 亚洲第一天堂网| 亚洲 欧美 激情 小说 另类| 国产国语亲子伦亲子| 日韩精品国产精品| 精品电影在线观看| 亚洲影院色无极综合| 日本一级片免费| 久久久久久久久久久网| 国产高清免费在线观看| 不卡欧美aaaaa| 岛国av一区二区| 中文字幕日韩精品在线| www日韩av| 黄色免费网址大全| 中文 日韩 欧美| 2一3sex性hd| 蜜桃传媒一区二区亚洲av| 久久精品国产亚洲av高清色欲| 在线观看xxxx| 国产一区二区三区在线观看精品 | 一区二区久久精品66国产精品| 国产亚洲综合在线| 亚洲国产天堂久久综合| 国产精品久久国产| 精品一区二区在线视频| 欧美丰满老妇厨房牲生活| 性欧美一区二区| 日本二三区不卡| 青青草视频在线视频| 99热这里只有精品在线| 国产精品免费久久| 欧美亚洲另类制服自拍| 亚洲在线色站| 国产真实乱在线更新| 91免费国产视频网站| 深夜福利亚洲导航| 国产精品中文久久久久久| 丁香六月色婷婷| 久久精品夜色噜噜亚洲aⅴ| 欧美天堂亚洲电影院在线播放| 亚洲性猛交xxxxwww| 久久久www免费人成黑人精品| 亚欧激情乱码久久久久久久久| 久久精品五月天| 久久日韩精品一区二区五区| 日本a级片电影一区二区| 四季av综合网站| 亚洲一区二区视频在线观看| 精品国产视频在线| 校园春色 亚洲色图| 精品人妻无码一区二区| 亚洲精品一区久久久久久| a在线观看免费视频| 99精品视频在线播放观看| 欧美中文字幕在线| 中文字幕一区二区人妻在线不卡| 奇米精品一区二区三区四区| 欧美一级片在线看| 国产免费黄视频| 久久综合激情| 亚洲人成网站色ww在线| 波多野结衣网页| 亚洲老妇色熟女老太| 日本韩国一区二区三区视频| 97超碰人人模人人爽人人看| 久久婷婷一区二区| 日韩精品一区二区在线观看| 天天综合色天天综合色hd| 黄色一级视频免费看| 精品国内产的精品视频在线观看| 青青操在线播放| 亚洲不卡一区二区三区| 国产精品极品美女在线观看免费| 亚洲欧美自拍视频| 亚洲免费视频网站| 已婚少妇美妙人妻系列| 国产精品美女久久久久久久久| 欧美精品尤物在线| 懂色中文一区二区在线播放| 成人亚洲激情网| 精人妻无码一区二区三区| 精品国产伦理网| 日韩欧美国产综合在线| 99久久精品免费看| 国产自产女人91一区在线观看| 久久精品无码av| 欧美一级片在线播放| 亚洲AV无码精品自拍| 亚洲欧美国产va在线影院| 丰满圆润老女人hd| 成人午夜在线视频| 中文在线一区二区| 国产精品久久7|