色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

英偉達含量為零!華為密集模型性能比肩DeepSeek-R1,純昇騰集群訓練

LiveCodeBench達到SOTA水平

克雷西 發自 凹非寺
量子位 | 公眾號 QbitAI

密集模型的推理能力也能和DeepSeek-R1掰手腕了?

華為利用純昇騰集群訓練出的盤古Ultra,在數學競賽、編程等推理任務當中,和R1打得有來有回。

關鍵是模型參數量只有135B,整個訓練過程零英偉達含量,而且沒有出現損失尖峰。

圖片

通過改進的模型架構和系統優化策略,盤古Ultra擁有優異的性能表現和52%以上的算力利用率。

并且有網友表示,訓練過程中沒有出現損失尖峰這一特征,似乎此前從未實現。

圖片

135B密集模型比肩DeepSeek-R1

作為一個參數量135B密集模型,盤古Ultra達到了同尺度密集模型的最優表現,甚至可以與DeepSeek-R1等參數量更大的MoE模型競爭。

在預訓練階段模型的評測中,盤古Ultra在絕大部分英文基準任務和全部中文任務上取得了最佳性能,優于Llama 405B、DeepSeek-V3等baseline模型。

尤其在MMLU、TriviaQA、GSM8K等具有挑戰性的數據集上,盤古Ultra展現出了卓越的語言理解和推理能力。

圖片

經過指令調優后,盤古Ultra的性能進一步提升,尤其在AIME 2024、MATH-500等數學推理任務和LiveCodeBench等編程競賽題上達到了SOTA水平。

綜合來看,盤古Ultra超越了包括GPT-4o、Mistral-Large 2等強大模型,與DeepSeek-R1等MoE模型競爭激烈。

同時,盤古Ultra在Arena Hard、MMLU-pro等涵蓋通用語言理解和推理的評測中也表現優異。

圖片

那么,為了實現這樣的效果,盤古Ultra采用了哪些關鍵技術呢?

“三明治”層歸一化架構

如前文所述,盤古Ultra是一款135B參數量的密集模型,使用了94層的網絡結構。

盤古Ultra采用了分組查詢注意力(GQA)機制,包含96個查詢頭(query head)和8個鍵值頭(key-value head)。

為了解決訓練超深網絡面臨的不穩定性和收斂困難等問題,盤古Ultra在模型架構上做出了兩個關鍵改進——深度縮放的Sandwich-Norm層歸一化和TinyInit參數初始化策略。

傳統的Transformer通常使用Pre-LN層歸一化,但在深度模型中,Pre-LN容易導致每個子層輸出尺度的波動,引發訓練不穩定。

盤古Ultra使用的Sandwich-Norm層歸一化,則是在殘差連接前對每個子層的輸出做歸一化,并根據網絡深度對初始化值進行縮放,從而有效消除了訓練過程中的loss尖峰,使訓練過程更加平穩。

用更容易理解的話說,傳統方法僅在每個子層的輸入進行歸一化,但這種方法針對輸出也進行了歸一化,形成了Pre-Norm + 子層 + Post-Norm的“三明治”結構。

圖片

但是,僅僅使用Sandwich-Norm還不足以完全消除深度模型訓練中的不穩定性——隨著網絡層數的增加,每一層的輸出尺度仍然可能出現累積性的漂移。

為此,盤古Ultra在Sandwich-Norm的基礎上,進一步引入了深度縮放機制,對Post-Norm中的放縮參數γ進行了深度相關的初始化。

圖片

至于整個模型的初始化,傳統的初始化通常采用的Xavier初始化方法僅考慮模型寬度,而盤古Ultra采用的TinyInit同時依據模型深度和寬度來縮放初始化權重的標準差。

這種初始化方式有助于在前向傳播和反向傳播過程中,維持各層梯度的方差在一個合理的范圍內,避免了梯度消失或爆炸問題,使得訓練過程更加穩定,同時也加速了收斂。

實驗表明,TinyInit在深度模型訓練中取得了更好的收斂速度和下游任務性能;同時針對embedding層,保持權重的標準差接近1也能提升訓練穩定性。

另外,盤古團隊也針對Tokenizer進行了優化,通過在通用中英文、代碼、數學等不同領域分別進行詞頻統計,再合并去重,最終得到了一個兼顧領域覆蓋和編碼效率的153376個token的平衡詞表。

圖片

8192張昇騰NPU訓練集群

盤古Ultra的整個訓練流程主要分為三個階段——預訓練、長上下文擴展和指令調優。

其中預訓練又可以分為三個子階段:

  • 通用階段:側重建立語言理解和知識儲備,使用了大量中英文通用語料,覆蓋網頁、書籍、百科等多個來源;
  • 推理階段:引入更多高質量的數學和代碼數據,以增強模型的推理能力。同時還使用instruction數據來幫助模型學習執行任務;
  • 退火階段:幫助模型鞏固知識和推理能力,并強化指令遵循能力。大量使用問答對和人類反饋數據。

研究者們采用了基于規則和模型的數據清洗方法,并設計了curriculum learning策略,讓模型循序漸進地學習不同難度的樣本。

預訓練中使用了AdamW優化器,并動態調整超參數。

圖片

預訓練后,模型在最長128K的長上下文數據上進一步訓練,通過擴大RoPE的基頻來實現長序列建模,以增強處理長文檔的能力。

最后的指令調優階則段使用監督微調(SFT)和強化學習(RL)來使模型更好地適應下游任務,學會執行指令并與人類偏好對齊。

訓練設施方面,盤古Ultra使用了一個由8192個昇騰AI處理器組成的大規模計算集群。

集群中每個節點包含8個NPU,通過華為高速緩存一致性互聯HCCS以全互聯的拓撲結構連接,每個NPU配備64GB內存,節點間則通過200Gbps的RoCE(RDMA over Converged Ethernet)網絡互聯。

為了實現盤古Ultra的高效訓練,研究團隊還采用了一套系統的并行策略和優化技術。

在并行策略的選擇上,盤古Ultra綜合考慮了模型的規模、數據的特性以及硬件的拓撲,最終采用了數據并行、張量并行、序列并行和流水線并行等多種并行方式的組合:

  • 128路數據并行,將訓練數據分片到不同設備,保證了數據吞吐;
  • 8路張量并行,利用設備內部高帶寬切分層內張量,實現高效通信;
  • 序列并行用于處理超長序列以降低顯存壓力;
  • 8段流水線并行,將不同層分布到不同設備,形成高效的計算流水線。
圖片

在并行策略的基礎上,盤古Ultra還從多個角度對訓練系統進行了深度優化。

一方面,通過使用ZeRO(Zero Redundancy Optimizer)分布式優化器,將模型狀態分片到不同設備,大幅降低了單個設備的內存占用,在提高數據并行度的同時,確保了每個設備的內存負擔在可接受范圍內。

另一方面,研究者們通過各種通信和計算優化技術,最小化了通信開銷,提升了計算效率:

  • 通過算子融合(Kernel Fusion)將多個小算子合并,減少了內存訪問和kernel啟動;
  • 通過通信計算重疊(Communication-Computation Overlapping)實現通信和計算的深度交織,隱藏通信延遲;
  • MC^2(Merged Computation & Communication)和BOA(Batch Optimization Accelerator)分別對張量并行和規范化層的通信進行了專門優化……
圖片

在算法、工程、數據各個層面的精細優化下,盤古Ultra實現了52%以上的算力利用率。

技術報告:
https://github.com/pangu-tech/pangu-ultra/blob/main/pangu-ultra-report.pdf

版權所有,未經授權不得以任何形式轉載及使用,違者必究。
91成人免费在线视频| 亚洲国产日韩欧美在线99| 538精品在线观看| 久久久久亚洲av无码专区喷水| 天堂网视频在线| 久草视频一区二区| 久久99精品国产91久久来源| 久久爱www久久做| www.亚洲欧美| 99视频有精品| 国产精品亚洲欧美导航| 久久久久久久久久久久久女过产乱| 亚洲成人免费在线| 精品蜜桃一区二区三区| 亚洲理论中文字幕| 少妇高潮一69aⅹ| 97在线观看视频| 亚洲另类xxxx| 欧美久久久久久久久中文字幕| 91黄色免费看| 美国av一区二区三区| 日本黄大片一区二区三区| 免费三级在线观看| 国产一级精品毛片| 亚洲精品喷潮一区二区三区| 国产精品乱人伦| 日本午夜在线亚洲.国产| 国产亚洲精久久久久久无码77777| 91精品国产色综合久久| www.国产在线播放| 无码人妻精品一区二区蜜桃色欲| 久久精品国产网站| 欧美日韩一区二区三区| 91av免费观看91av精品在线| 九色在线视频观看| 国产日韩精品电影| 久久6精品影院| 国产亚洲欧美日韩一区二区| 欧美国产日韩一区| 风间由美久久久| 国产精国产精品| 久久久九九九热| 久久久久久久久久久久久国产| 中文字幕久久久久| 国产视频不卡在线| 波多野结衣加勒比| 成人免费视频国产免费观看| 久久精品www| 亚洲欧美日韩在线| 91精品国产三级| 91精品国产麻豆国产自产在线| 亚洲视频在线不卡| 亚洲va在线观看| 久久精品夜夜夜夜久久| 国产一区二区三区丝袜| 日本a级片在线观看| 亚洲欧美日韩免费| 国产成人午夜精品5599| 精品一区二区三区在线播放视频 | 91免费精品国自产拍在线不卡| 国产精品一区二区三区免费视频 | 色综合视频在线| 97av在线视频免费播放| 日韩电影在线观看网站| 26uuu久久噜噜噜噜| 狠狠人妻久久久久久| 亚洲国产精品视频在线观看| 亚洲人精品午夜射精日韩| 日本天堂在线视频| 亚洲一区二区三区四区五区黄| 国产精品久久久久久久久影视| 荫蒂被男人添免费视频| 亚洲一级黄色录像| 岛国av中文字幕| 青青草精品视频| 亚洲精品456在线播放狼人| 午夜免费看毛片| 五月婷婷伊人网| 色狠狠av一区二区三区香蕉蜜桃| 久久久久久欧美精品色一二三四| 实拍女处破www免费看| 久久久精品电影| 精品久久久久久久久久| 国产偷人爽久久久久久老妇app| 国产在线观看免费视频软件| 97人妻精品一区二区三区| 成人国产精品免费| 欧美一区二区三区喷汁尤物| 亚洲黄色小说视频| 欧美精品久久天天躁| 亚洲精品免费网站| 在线视频 中文字幕| 一级片免费网址| 久久99日本精品| 亚洲图片在区色| 国产一卡二卡三卡四卡| 欧美日韩在线观看成人| 久久婷婷色综合| 鲁丝片一区二区三区| 97久久久精品综合88久久| 亚洲第一网中文字幕| 色婷婷免费视频| 欧美精品一区二区三区一线天视频| 日韩一区二区在线免费观看| 久久久精品高清| 欧美性猛交xxxx| 亚洲欧美在线观看视频| 色中文字幕在线观看| 日韩国产激情在线| 动漫美女无遮挡免费| 精品视频在线观看免费| 欧美一区二区三区视频免费播放 | 97超碰人人看人人| 性农村xxxxx小树林| 无码h黄肉3d动漫在线观看| 亚洲视频国产视频| 国内精品伊人久久久久影院对白| 美女啪啪无遮挡免费久久网站| 五月天综合在线| 欧美高清一级大片| 国产精品自拍视频在线| 91视频免费观看| 欧美精品一区视频| 国产精品午夜福利| 吴梦梦av在线| 在线成人av网站| 欧美特级黄色录像| 国产精品不卡一区二区三区| 久久久久久久久久伊人| 亚洲三级理论片| 亚洲人成网站在线观看播放| 中文字幕乱码在线观看| 91精品在线国产| 精品久久久久久| 国产九九在线观看| 中文字幕欧美日韩精品| 午夜福利理论片在线观看| 69堂成人精品免费视频| 9999热视频| 日韩一级黄色av| 亚洲系列中文字幕| 天天躁日日躁aaaxxⅹ | 五月天中文字幕| 九九久久久久久久久激情| 久久视频免费在线观看| www.久久久久久.com| 国产真实的和子乱拍在线观看| 一区二区三区国产在线观看| 久久久久久久福利| 亚洲天堂开心观看| 午夜精品三级久久久有码| 裸体女人亚洲精品一区| 亚洲天堂视频在线播放| 欧美一级视频在线观看| 蜜臀av免费在线观看| 91久久国产自产拍夜夜嗨| 亚洲精品一区二区三区新线路| 国产美女搞久久| 蜜桃一区二区三区在线观看| 精品一卡二卡三卡四卡日本乱码| 国产河南妇女毛片精品久久久| 亚洲精品一区二区三区四区五区 | 天天操天天操天天操| av一本久道久久波多野结衣| 国内不卡的二区三区中文字幕| 亚洲春色在线视频| 亚洲天堂精品视频| 国内自拍第二页| 日韩精品一区在线| 国产大片aaa| 51精品国产黑色丝袜高跟鞋| 久久香蕉精品| 亚洲精品一卡二卡三卡四卡| 最新国产の精品合集bt伙计| 特级西西444www| 亚洲福利视频在线| 黄色av一级片| 亚洲一区二区三区在线视频| 成人丝袜高跟foot| 日本黄网站免费| 欧美日韩视频在线第一区 | 久久精品一卡二卡| 日韩一区二区三区视频在线观看| 国产亚洲自拍av| 欧洲美女免费图片一区| 国产在线一区二区综合免费视频| av女优在线播放| 欧美日韩一区二区在线视频| 国产无码精品在线观看| 成人av在线亚洲| 99国产精品一区| 伊人成人222| 亚洲欧美日韩区| 欧美特黄一级视频| 在线观看成人av| 一本色道综合亚洲| 久久这里只有精品国产| 国产欧美一区二区三区视频| 91丨porny丨蝌蚪视频| 天堂在线一区二区三区| 中文国产亚洲喷潮| 久久亚洲精选| 无码精品a∨在线观看中文| 日韩视频在线观看一区二区| 亚洲天堂aaa| 视频在线精品一区| 91久久精品一区二区三区| 国产小视频在线免费观看| 国产精品一级久久久| 亚洲地区一二三色| 国产精品suv一区二区69| 91|九色|视频| 亚洲成a人片综合在线| 欧美成人免费看| 福利视频一区二区三区| 日本大胆人体视频| 日本高清不卡的在线| 蜜桃视频第一区免费观看| 成人性免费视频| 日韩理论片久久| 日韩中文字幕一区二区三区| 91视频最新入口| 精品亚洲一区二区三区| 日韩专区欧美专区| 午夜天堂在线视频| 国模精品一区二区三区色天香| 亚洲视频免费播放| 欧美激情一区在线观看| 免费成人深夜夜行p站| 性欧美暴力猛交69hd| youjizz久久| 北岛玲一区二区| 欧美怡春院一区二区三区| 日本一区二区三级电影在线观看| 精品熟妇无码av免费久久| 91网站在线免费观看| 亚洲国产中文字幕在线视频综合| 国产成人无码精品亚洲| 色综合电影网| 精品国产三级a在线观看| 欧美aaaaa成人免费观看视频| 亚洲黄色小视频| 农村妇女精品一区二区| 懂色av一区二区三区在线播放| 五月激情六月综合| 亚洲专区在线播放| 国产av国片精品| 欧美成aaa人片在线观看蜜臀| 不卡的看片网站| 欧美激情 一区| 国产精品毛片va一区二区三区| 欧美色图在线视频| 亚洲AV无码一区二区三区少妇| 99蜜桃臀久久久欧美精品网站| 久久亚洲精品中文字幕冲田杏梨| 成人免费av在线| 青花影视在线观看免费高清| 日本一区免费看| 亚洲欧美激情另类校园| 91影院在线观看| 国产午夜精品无码一区二区| 日韩中文在线字幕| 色av吧综合网| 国产精品国产三级国产普通话蜜臀| 欧美一二三区视频| 久久久性生活视频| 欧美交受高潮1| 亚洲6080在线| 手机看片1024日韩| 亚洲男人在线天堂| 久久亚洲国产精品日日av夜夜| 亚洲高清久久网| 成人免费视频网站在线观看| 精品在线免费观看视频| 久久亚洲中文字幕无码| 4k岛国日韩精品**专区| 欧洲精品一区二区| 极品少妇一区二区三区精品视频| av黄色免费在线观看| 超碰人人爱人人| 91国内在线视频| 欧美四级电影在线观看| 激情综合色综合久久| 九九热精彩视频| 国内外免费激情视频| 国产精品亚洲欧美导航| 日韩一区二区三区电影| 91麻豆成人久久精品二区三区| 国产亚洲欧美日韩高清| 精产国品一二三区| 欧美日韩在线播放一区二区| 久久国产天堂福利天堂| 欧美日韩加勒比精品一区| 日本欧美在线观看| 亚洲色图27p| 黄色国产精品视频| 高清国产在线一区| 日韩小视频在线| 日韩欧美亚洲成人| 成人午夜在线播放| 国产理论片在线观看| 性欧美精品男男| 久久视频这里有精品| av一区二区三区在线观看| xvideos成人免费中文版| 日韩欧美精品在线观看| 久久日韩精品一区二区五区| 高清一区二区三区四区| 精品欧美一区二区久久久久| 国产三级精品三级在线| 亚洲一区二区三区精品视频| 国产精品久久网| 深夜福利一区二区| 欧美日韩黄视频| 国产精品欧美极品| 久久99国产精品久久99 | 国产一线二线三线女| 亚洲综合在线做性| 欧美大片免费观看| 精品国产乱码久久| 精品久久中文字幕久久av| 91欧美激情一区二区三区成人| 国内爆初菊对白视频| 日韩少妇高潮抽搐| 成年人的黄色片| 国产av人人夜夜澡人人爽| 亚洲国产一区在线| 2014国产精品| 97视频免费在线看| 亚洲欧洲日产国码av系列天堂| 91久久精品国产91性色tv | 久久精品国产秦先生| 在线观看免费黄色小视频| 国产又粗又长免费视频| 中文字幕亚洲欧洲| 男人的天堂狠狠干| 色中文字幕在线观看| 久久久www免费人成黑人精品| 国产精品9999| 国内精品400部情侣激情| 国产一区二区欧美日韩| 精品欧美一区二区久久| 在线观看网站黄不卡| 一区二区欧美精品| 国产精品婷婷午夜在线观看| 成人性生交大合| 精品一区二区久久久| 久久久久91| 欧美 日韩 国产 精品| 91精品国自产| 最好看的日本字幕mv视频大全| 国产在线精品观看| 久久国产精品波多野结衣| 国产大屁股喷水视频在线观看| av无码一区二区三区| 久久99欧美| 国产精品一区二区在线看| 国产色片在线观看| 欧美h在线观看| 国产福利拍拍拍| 欧美日韩三级在线观看| 国产馆在线观看| 黄色片网站免费| 污污内射在线观看一区二区少妇| 成人亚洲免费视频| 一级黄色录像在线观看| 亚洲最大成人在线观看| 国产自偷自偷免费一区| 粉嫩虎白女毛片人体| 日韩欧美国产免费| 欧美色图另类小说| 中国丰满人妻videoshd| 老太脱裤子让老头玩xxxxx| 黄色特一级视频| 男女猛烈激情xx00免费视频| 天天夜碰日日摸日日澡性色av| 免费观看美女裸体网站| 欧美视频免费播放| 激情 小说 亚洲 图片: 伦| 三级在线视频观看| 波多野结衣在线免费观看| 中文字幕无人区二| 人妻少妇精品视频一区二区三区| 人妻在线日韩免费视频| 欧美激情亚洲色图| 日本高清一二三区| 日本网站免费观看| 国产成人a v| 亚洲伦理在线观看| 日本午夜精品一区二区三区电影 | 精品视频一二三区| 亚洲天堂avav| 天天色综合久久| 国产一区二区美女| 91麻豆文化传媒在线观看| 欧美激情一区二区在线| 亚洲视频1区2区| 一本色道**综合亚洲精品蜜桃冫 | 中文字幕一区二区三区不卡| 一区二区三区高清不卡| 欧美唯美清纯偷拍| 日韩久久精品成人| 久久免费视频在线| 亚洲字幕一区二区| 手机成人在线| 日本在线视频www| www.自拍偷拍| 欧美啪啪小视频| 亚洲人妻一区二区| 久久综合色之久久综合|