色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

螞蟻國產GPU訓練大模型細節曝光!Ling模型研發負責人回應

國產芯片的訓練成本與英偉達相當甚至更低,

轉自 知乎

作者 張志強 螞蟻Ling模型研發負責人

螞蟻開源大模型的低成本訓練細節,疑似曝光!

這段時間,螞蟻一篇技術論文引發關注。論文中顯示,他們推出的兩款MoE大模型,能夠在國產GPU上完成與英偉達同效的訓練。一時間,該消息在技術圈發酵,登上了熱搜,甚至還傳出「計算成本低于DeepSeek」一些傳聞。

螞蟻國產GPU訓練大模型細節曝光!Ling模型研發負責人回應

現在,螞蟻Ling模型研發負責人張志強在知乎上作出了回應。

他發布長文《關于我們摳 FLOPS 的一些點滴》,分享了他們一些大模型訓練的經驗和教訓。

螞蟻國產GPU訓練大模型細節曝光!Ling模型研發負責人回應

包括訓練正確性對齊、Router TP(Tensor Parallelism)bug 修復、訓練穩定性等問題的解決。

最后還回應了外界對于他們成本計算的誤解,并表示不管是在 GPU 還是在國產加速卡上,LLM 的訓練成本優化都是無止境的。

Ling 的訓練過程一定程度地說明,在我們做的這些技術努力上,國產加速卡的訓練成本與 GPU 相當甚至更低,同時可以保證 Loss 收斂一模一樣

在不改變原意的基礎上,量子位做了如下整理在此分享給大家,希望能給大家帶來一定的啟發。

(量子位已獲原作者授權)

關于我們摳 FLOPS 的一些點滴

本周開始看到有媒體關注我們團隊的模型訓練成果,其實月初我們就在 GitHub 和 Hugging Face 上發布了 Ling 模型權重和技術報告(https://arxiv.org/abs/2503.05139),名字就叫「EVERY FLOP COUNTS」,關于使用非 NVIDIA 加速卡集群訓練 Ling 300B MoE 大模型的一些技術細節。我們的技術報告被外媒記者發現了,“出口轉內銷”地被關注到。其實我們本來就準備在月底的小型技術沙龍上分享經驗教訓的,既然被關注到了,就來提前說明一下吧。

從開源來,回社區去

即使如最近大熱的 DeepSeek,也受限于算力問題進行了很多精彩的優化,對于我們一線研發人員來說,克服環境的限制就是工作。眾所周知,和國外的大模型團隊相比,中國團隊面對了更多的異構加速卡的挑戰,我們并不是第一家面對異構問題的公司,比如智源研究院就發起了 FlagScale 項目,研發面向異構加速卡的訓練框架。有了開源社區,我們可以利用同行們的前期探索作為工作的基礎。
同樣,我們的實踐成果也回饋給社區,希望可以幫助社區減少不必要的重復勞動。螞蟻在去年開源 DLRover 項目(https://github.com/intelligent-machine-learning/dlrover ),報告提到的輕量級選擇性跟蹤框架 XPUTimer 就集成在 DLRover 上,可以為不同算力平臺上的大規模訓練任務提供監控診斷功能。希望這些對社區的回饋,可以給大家帶來一些啟發。

一些收獲和經驗教訓

在寫這份技術報告時,我們希望分享 Ling 研發過程的一些關鍵 insight。Insight 可以是 novelty story,也可以是 bitter lesson。這里和大家聊聊我們得到的一些教訓。作為較早吃螃蟹的人,分享這些教訓并不是想吐槽,只是希望可以幫助其他同行避開一些問題,當然也希望可以促進國產加速卡的更快成熟。下面展開聊一聊幾個我印象深刻的 bitter lesson。

訓練正確性對齊

為了讓大規模 MoE LLM 可以在多個算力平臺上進行無縫切換訓練,訓練正確性對齊是必不可少又極其繁瑣的一個過程。對齊有不同的標準,比如在不同平臺訓練都可以正常收斂是一個標準,而算子精度、訓練框架、loss 完全對齊又是另外一個標準?!昂苌岛芴煺妗钡奈覀儽局夹g問題應該知其然又知其所以然的信念,定下了一個非常嚴格標準,基礎算子(除符合預期的精度誤差)完全對齊 + 分布式訓練框架前后向計算完全對齊 + 大規模訓練長跑 loss 差異低于 0.1%,當然這也換來了無數個通宵 debug 的難忘體驗。

有趣的是,在做正確性對齊的過程中,我們同步也在做關于 scaling law 的研究。我們發現,通過設計一個合理的外推擬合方法,在不進行真實訓練的情況下,一個尺寸較大(比如 20B、80B)的模型在正式訓練較長時間(比如 2T token)后的 loss,可以被一系列 1B 以下的小尺寸模型的訓練外推預測,其預測誤差低于 0.5%。這樣看來,跨平臺訓練的 loss 差異低于 0.1% 其實是一個合理的要求。

在算子對齊上,我們將不同平臺的基礎算子進行了完全對齊實現,比如 matmul、linear 等。

Router TP(Tensor Parallelism)bug 修復

在框架上,FSDP 向 MindSpeed(Megatron)對齊引入 tensor parallelism 特性會導致一系列模型收斂問題,尤其是在 MoE 相關的 router 部分非常嚴重。這里展開講一下我們的工作。

在 router 的前向計算上,由于 sp(sequence parallel)在 Megatron 中對 router 的輸入進行了切分,導致其輸入并不完整,因此在 router 相關 loss 計算(包括 load_balance_loss 和 z_loss)時會額外使用 gather 操作將不同 sp rank 上的數據同步到一起,以進行完整 batch 計算。這個過程并沒有專門針對反向進行對應的 reduce 實現,會導致回傳梯度重復,需要手動對 router 相關的 loss 系數進行放縮。值得注意的是該 bug 已經在 Megatron 0.7.0 版本修復;當時 MindSpeed 支持到 0.6.0 版本,因此需要進行額外 patch 修復。

在 router 的反向計算上,Megatron 對 router 通過 gather 操作獲取了完整的 logits,而 MindSpeed 在后續的 permute/unpermute 操作中需要強制使用 local logits,因此額外進行一次 scatter 操作來進行切分,出現了 loss 不斂性問題。經過排查,我們發現是 scatter_to_sequence_parallel_region在反向實現中進行了一次 _gather_along_first_dim操作導致梯度比正常梯度更大。最終我們在每一次 scatter 操作之后添加了對應的 gradient_scale 實現以保證梯度的正確性,從而滿足 loss 收斂的需求。

NormHead 遷移

參考百川的訓練經驗,我們也采用了 NormHead 來保證訓練的穩定(雖然初衷是為了保證訓練穩定,但是后來通過 scaling law 分析,我們發現 NormHead 在 loss 上也會帶來一些優勢)。NormHead 從 FSDP 遷移到多 D 并行的 MindSpeed/Megatron 上也遇到了問題。
FSDP 上的參數在邏輯上是沒有被切分的,因此 NormHead 的實現非常簡單高效,通過 Torch 原生自帶的 torch.nn.functional.normalize 即可完成對 lm_head.weight 標準化操作。在 MindSpeed/Megatron 中,由于涉及到了多 D 并行,因此需要修改 NormHead 的實現方法進行適配。最直接簡單的方案就是結合 torch.nn.functional.normalize 的實際計算過程,將本地設備上的 lm_head.weight 先進行標準化計算,最后使用 reduce 對標準化后的 lm_head.weight 值進行同步。遺憾的是我們發現這樣實現無法保證 loss 收斂,分析其原因主要是由于在不同機器上進行數據同步采用 Megatron.core.tensor_parallel.mappings._ReduceFromModelParallelRegion,而該方案沒有在反向傳播過程中實現對應的梯度同步,最終導致 loss 上升;于是我們重寫了一版_ReduceFromModelParallelRegionForNormHead并實現了對應的反向以保證loss收斂。另一方面,國產加速卡的某些算子可能不支持 BF16 計算,而 FP32 的算子計算效率遠低于 BF16 算子,為了防止在多 D 并行中阻塞住模型的整體計算,需要對 NormHead 性能進行優化。我們設計了基于 all2all 通信的 NormHead 實現以及 HeadNormCache 等方案,以在國產加速卡上達到更優的計算效率。

訓練穩定性

與 GPU 相比,國產加速卡在穩定性上確實存在不少問題,時常會遇到由于機器不穩定帶來的 loss 以及 grad 異常,從而引發尖刺,影響模型的收斂過程。為了緩解這些問題,我們設計了兩種不同的尖刺處理機制。

對于 loss 尖刺,我們會把歷史最近的一部分 loss 作為參考,如果當前 loss 與參考的歷史 loss 均值相比有明顯的上升,我們就會跳過這一步的訓練直接開始下一步,或直接降低這一步的學習率來減少影響。這種方法在大多數情況下是有效的,可以很好地緩解訓練不穩定問題。

但我們在實驗觀察中發現,loss 尖刺處理機制并不能解決所有的訓練不穩定問題,因為 loss 是模型訓練過程的一個很宏觀的表現,模型的狀態在 loss 產生尖刺之前可能已經出現了不穩定。Grad 會直接作用于模型參數,對其監控相比于 loss 更加迅速,因此我們也開發了 grad 尖刺處理機制。參考 loss 尖刺的實現,我們在自研的 ATorch 框架中對所有的 _ParamAndGradBuffer 進行處理,從而實現對模型 grad 的監控。如果 grad 出現異常就跳過這一步訓練。通過 grad+loss 尖刺處理機制,可以自動處理大部分的 loss 異常。

成本的計算

這次大家的一些誤解也源于對成本計算的方式,其實我們在成本計算上使用了學術界比較通行的計算方法,這里也簡單介紹一下。

根據在不同平臺上對 Ling-Plus 的真實訓練記錄,我們可以觀察到某個平臺在 K 張加速卡上持續一段時間(比如一周)的 token 數,再根據技術報告表 1 上提到的不同加速卡的單位時間成本,就可以很簡單地計算出對應平臺上訓練單位 token 量(報告里以 1 萬億 token 為單位)的成本。

螞蟻國產GPU訓練大模型細節曝光!Ling模型研發負責人回應

事實上,不管是在 GPU 還是在國產加速卡上,LLM 的訓練成本優化都是無止境的。Ling 的訓練過程一定程度地說明,在我們做的這些技術努力上,國產加速卡上的訓練成本與 GPU 相當甚至更低,同時可以保證 loss 收斂一模一樣。

未來的工作

Ling 模型的發布只是我們工作的一個里程碑,后續我們還會進一步改進自己的工作。DeepSeek 為我們對訓練經濟性的提升帶來了啟發,DeepSeek 在訓練中使用了 FP8 證明了這樣的低精度浮點數是可以訓練出來優秀的大模型的;同樣我們兄弟團隊基于強化學習的 AReaL(https://github.com/inclusionAI/AReaL)也開源了,強化學習也是通往 AGI 之路的重要一環。我們后續的更多工作也會陸續開源在 inclusionAI org(https://huggingface.co/inclusionAI)里。

每個 AI 研發工程師都相信 AGI 必將到來。我們相信 AGI 一定是普惠大眾的,感謝大家的關心,期待未來的工作也能受到持續關注。

知乎鏈接:
https://zhuanlan.zhihu.com/p/1888526583813350974

版權所有,未經授權不得以任何形式轉載及使用,違者必究。
一本一道久久a久久精品| 国产中文字幕视频| 亚洲成人激情图| av在线播放中文字幕| 自拍视频国产精品| 夜夜嗨av禁果av粉嫩avhd| 国产精品啪视频| 人人精品人人爱| 欧美日韩亚洲一区二区三区在线观看| 91捆绑美女网站| 国产精品69页| 91精品一区二区三区在线观看| 三区四区在线观看| 蜜臀久久99精品久久久无需会员 | 三叶草欧洲码在线| 国产亚洲精品久久久久动| 一区二区三区黄色片| 成人av网站观看| 国产日韩欧美精品综合| www.午夜av| 亚洲欧美日韩久久久久久| 在线视频1卡二卡三卡| 成人免费91在线看| 国产欧美视频一区二区| 男人的天堂免费| 一本一道久久a久久精品逆3p| 亚洲最大成人av| 蜜桃视频在线观看成人| 中文字幕一区二区三区在线不卡| 18禁一区二区三区| 久久久成人精品| 久久亚洲色图| 一本久道高清无码视频| 欧美丰满少妇xxxbbb| 在线观看精品国产| 国产精品对白刺激久久久| 国产精品第一页第二页第三页| 日本一级片在线播放| 久久久精品一区二区三区| 日本aⅴ精品一区二区三区 | 国产伦理精品不卡| 国产熟女高潮视频| 日韩精品视频三区| 国产jzjzjz丝袜老师水多| 亚洲一区二区三区加勒比 | 精品黑人一区二区三区在线观看 | 三级黄色片免费看| 欧美理论片在线观看| 免费看日韩精品| 激情视频综合网| 亚洲女人初尝黑人巨大| 久久精品麻豆| 成年人网站大全| 国产亚洲一区二区精品| 日韩电影一区二区三区四区| 免费无码av片在线观看| 日韩精品免费综合视频在线播放 | 精品人妻一区二区免费| 欧美麻豆久久久久久中文| 久久91精品国产91久久小草| 日韩成人av免费| 久久久精品中文字幕| 国产福利一区二区| 国产人成视频在线观看| 欧美最猛性xxxx| 国产精品拍天天在线| 日本不卡一区视频| caoporen国产精品| 岛国av午夜精品| 一级特黄免费视频| 992tv成人免费观看| 日韩精品视频在线| 国产一区二区三区美女| 插我舔内射18免费视频| 国产精品嫩草视频| 亚洲成人在线观看视频| 99超碰在线观看| 在线免费观看成人| 亚洲久久久久久久久久久| 美女性感视频久久| 黄色网址在线视频| 91亚洲午夜在线| 色悠悠久久综合| 国产欧美一级片| 欧美日韩黄色一级片| 久久精品视频在线播放| 91色porny在线视频| 成人一级片免费看| 久久伊人资源站| 日韩精品中文字幕在线不卡尤物| 久久久精品五月天| 精品人妻一区二区乱码| 国产色婷婷国产综合在线理论片a| 一区二区三区色| 一区二区三区在线免费观看视频 | 欧美黄色免费网站| 国产精品日韩精品欧美在线| 国产精品成人aaaa在线| 好色先生视频污| 最近2019中文字幕大全第二页| 不卡一区在线观看| 印度午夜性春猛xxx交| 亚洲在线视频一区二区| 在线视频国产日韩| 欧美国产一区在线| 老熟妇一区二区三区| 久久久久久久午夜| 韩国美女主播一区| 亚洲国产日韩一区二区| 亚洲不卡免费视频| 最新国产精品自拍| 国产欧美日韩视频一区二区三区| 日韩欧美在线观看一区二区三区| 久热成人在线视频| 美国精品一区二区| 黄瓜视频免费观看在线观看www| 中文字幕精品一区久久久久 | 黑人一级大毛片| 国产女大学生av| 国产91精品视频在线观看| 色偷偷久久人人79超碰人人澡| 日本精品一二区| 泷泽萝拉在线播放| 日日噜噜噜噜夜夜爽亚洲精品| 一区二区日韩精品| 亚洲人成亚洲人成在线观看图片| 国产日韩欧美中文字幕| 北京富婆泄欲对白| 免费精品视频一区二区三区| 中文日韩在线视频| 亚洲综合一二区| 久久狠狠婷婷| 精品少妇一区二区三区密爱| 免费的av在线| 欧美一级大片在线观看| 欧美日本不卡视频| 成人午夜激情影院| 欧美在线视频精品| av影片在线播放| 看高清中日韩色视频| 久久人人爽人人爽人人片亚洲| 亚洲欧美精品午睡沙发| 香蕉av在线播放| 日本在线一级片| 国产一级片黄色| 高清av免费一区中文字幕| 亚洲性猛交xxxxwww| 亚洲综合一区二区| 韩国成人精品a∨在线观看| 久草国产精品视频| 绯色av蜜臀vs少妇| 亚洲成人第一| 欧美又大又粗又长| 亚洲白拍色综合图区| 国产精品不卡在线| 天堂一区二区在线免费观看| www.超碰在线观看| 男女视频在线看| 欧美精品亚洲精品| 91av视频在线播放| 精品国产伦一区二区三区观看方式| 国产精品区一区二区三区| 久久久久久色| 三级黄色在线视频| 69亚洲乱人伦| 成人午夜免费在线| 成人精品一二区| 欧美极品美女电影一区| 日韩一本二本av| 亚洲精品久久久蜜桃| 国产一区不卡在线| 91精品中文字幕| 中文字幕观看av| 日韩高清在线一区二区| 艳母动漫在线观看| 99久久自偷自偷国产精品不卡| 久久激情视频久久| 欧美一卡2卡3卡4卡| 亚洲精选视频免费看| 国产一区二区三区免费观看| 国产精品久久久久久免费免熟 | 亚洲黄色在线观看视频| 欧美三级在线免费观看| 久久久久亚洲AV成人网人人小说| 日本精品福利视频| 国产精品免费一区二区三区| 久久久视频免费观看| 精品一区二区三区三区| 一本大道久久a久久精二百| 国产日韩欧美a| 久久超碰97中文字幕| 国产又粗又猛又色又| 一区二区国产精品精华液| 久久国产激情视频| 日韩精品在线中文字幕| 日韩成人av网站| 91久久久精品| 久久久久久中文字幕| 国产亚洲欧洲高清| 日韩欧美国产精品| 在线一区二区视频| 亚洲美女视频在线观看| 91老司机福利 在线| 精品一区二区三区久久| 欧美一级在线免费观看| 波多野结衣电车痴汉| 青青青在线免费观看| 97人妻精品一区二区免费| 制服丝袜中文字幕第一页| 免费看国产曰批40分钟| 亚洲五月六月| 免费在线一区二区| 亚洲aaa激情| 国产精品www| 久久久久久久久久久亚洲| 少妇av一区二区三区| 日韩av在线免费播放| 日韩一区二区视频| 欧美视频在线一区二区三区| 精品久久久久久亚洲国产300| 国产精品理论片| 久久久噜噜噜久噜久久综合| 国产精品性做久久久久久| 秋霞电影网一区二区| 日本黄色三级视频| 高h调教冰块play男男双性文| 伊人免费在线观看| 国产午夜麻豆影院在线观看| 97人人澡人人爽人人模亚洲| 欧美在线视频第一页| 欧美性受xxxx黑人| 亚洲天堂成人av| 加勒比精品视频| 久久人人爽人人人人片| 亚洲成年人av| 精品人妻一区二区三区日产乱码卜| 男人添女人荫蒂国产| 亚洲男人天堂2021| 国产在线a视频| 91porn在线| 在线观看国产网站| av网在线播放| 国产一二三av| 成人免费视频网站入口::| 久久精品在线观看视频| 欧美色图17p| 午夜免费激情视频| 国产精品成人国产乱| 日韩男人的天堂| 亚洲久久在线观看| а中文在线天堂| 国产精品无码免费播放| 国产视频一区二区三区四区五区| 国产黄色大片网站| 天天干免费视频| 蜜桃91丨九色丨蝌蚪91桃色| 激情欧美一区二区| 成人av电影在线网| 国产欧美日韩三级| 中文字幕在线观看不卡视频| 夜夜精品视频一区二区| 欧美午夜精品久久久久久人妖| 色悠悠亚洲一区二区| 欧美一区二区三区四区在线观看 | 成人一区二区视频| 91麻豆123| 亚洲免费成人av| 欧美日韩色婷婷| 欧美军同video69gay| 日韩一卡二卡三卡四卡| 亚洲美女中文字幕| 操人视频在线观看欧美| 51视频国产精品一区二区| 国产在线精品播放| 久久伊人一区| 大西瓜av在线| 色一情一区二区| 熟女人妻在线视频| 免费日韩在线视频| 在线观看免费高清视频| 久久中文在线| 不卡av免费在线观看| 国产精品女同互慰在线看| 欧美日韩国产专区| 日韩一区和二区| 视频在线观看99| 国产精品久久久久久久久| 韩国一区二区三区美女美女秀 | 三级不卡在线观看| 成人avav影音| 亚洲制服丝袜av| 欧美xxxx老人做受| 欧美成aaa人片免费看| 国产一区二区在线免费视频| 欧美亚洲爱爱另类综合| 欧美日韩一道本| 北岛玲一区二区| 国产无码精品久久久| 国产女人18毛片18精品| 国产做a爰片久久毛片| 国产精品福利一区二区| 欧美亚洲一区二区在线观看| 亚洲人成电影网站| 日韩免费av片在线观看| 久久伊人一区| 日本888xxxx| 亚洲一二三四视频| 伊人色综合久久久| 国产乱码精品一品二品| 自拍偷拍国产精品| 日韩欧美专区在线| 97在线视频免费看| 欧美三级网色| 五月天亚洲视频| 久久久久99精品成人| 96日本xxxxxⅹxxx17| 国产黄色成人av| 午夜成人在线视频| 亚洲色图25p| 成人午夜高潮视频| 成年人深夜视频| 国产成人无码一区二区在线观看| 国产99久久久| 激情深爱一区二区| 天天射综合影视| 一区二区三区国产视频| 91色p视频在线| 欧美午夜性视频| 久久亚洲无码视频| 国产高清免费av| 久久婷婷色综合| 在线成人免费观看| 69视频在线播放| 艳母动漫在线免费观看| 波多野结衣先锋影音| 亚洲一级在线播放| 91色婷婷久久久久合中文| 91精品婷婷国产综合久久竹菊| 久久久久久午夜| 亚洲人久久久| 亚洲国产精品成人综合久久久| 伊人精品一区二区三区| 91浏览器在线视频| 精品久久久久久久人人人人传媒| 国产suv精品一区二区| 成人在线播放网址| 日本在线一级片| 精彩视频一区二区三区| 欧美日韩中文字幕| 欧美激情视频一区二区| 亚洲欧美日韩在线综合| 精品国产人妻一区二区三区| 国产成年妇视频| 亚洲同性同志一二三专区| 亚洲亚裔videos黑人hd| 国产一级二级三级精品| 又黄又爽又色的视频| 在线观看中文字幕网站| 国产亚洲美州欧州综合国| 亚洲精品国产欧美| 国产伦精品一区二区三区免| 国产一区二区在线观看免费视频| 樱花视频在线免费观看| 国产欧美日本一区视频| 亚洲国产91精品在线观看| 91嫩草国产在线观看| 污污的视频免费| 国产精品尤物视频| 中文子幕无线码一区tr| 最近2019免费中文字幕视频三| 欧美日韩另类综合| 亚洲精品国产91| 卡一卡二国产精品| 欧美一区二区久久| 不卡一区二区三区视频| www.美色吧.com| 国产香蕉在线观看| 色综合天天做天天爱| 国产精品7m视频| 亚洲欧美偷拍另类| 国产精品老熟女视频一区二区| 亚洲欧美成aⅴ人在线观看| 久精品免费视频| 国产一级爱c视频| 中文字幕视频网| 亚洲丝袜精品丝袜在线| 九九久久综合网站| www黄色日本| 亚洲天堂手机版| 亚洲韩国精品一区| 欧美在线视频a| 日本高清久久久| 免费av网站观看| 精品视频色一区| 成人性色av| 国产精品国产三级国产专业不 | 欧美特黄一级视频| 欧美在线高清视频| 51精品国产人成在线观看| 久久久久99人妻一区二区三区| 天天干天天草天天射| 欧美日韩亚洲另类| 国内精品二区| 国产尤物在线播放| 久久亚洲精品小早川怜子| 日韩在线播放一区| 女性女同性aⅴ免费观女性恋| 一区二区视频免费| 91福利区一区二区三区| 国产精品一区二区av|