色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

跳過“逐字生成”!螞蟻集團趙俊博:擴散模型讓我們能直接修改Token | MEET2026

dLLM的訓練推理仍處于早期發展階段

當主流大語言模型還在采用自回歸架構時,有人已經盯上了擴散架構。

在本次量子位MEET2026智能未來大會上,浙江大學百人計劃研究員、博士生導師,螞蟻集團資深技術專家趙俊博表示:

擴散架構在推理過程中可以直接修改和控制token,而不需要像自回歸模型那樣重新生成整段內容。

這意味著,相比自回歸模型,擴散模型理論上有望實現更快的生成速度以及更低的計算成本。

基于此,他和團隊將重點押注于擴散架構,并致力于探索擴散語言模型獨有的Scaling Law。

而作為這一探索的關鍵里程碑,他們近期發布并開源了LLaDA 2.0,率先將擴散語言模型做到千億體量

趙俊博坦言,該領域在訓練與推理層面仍處早期,但發展勢頭迅猛,已吸引包括谷歌、字節在內的巨頭及一批初創公司積極布局。

編者注:就在MEET2026智能未來大會結束后,趙俊博和團隊也發布了全新的技術報告,揭示了千億體量擴散語言模型背后的關鍵技術選擇。
報告標題:LLaDA2.0: Scaling Up Diffusion Language Models to 100B
報告鏈接(github):https://github.com/inclusionAI/LLaDA2.0/blob/main/tech_report.pdf

跳過“逐字生成”!螞蟻集團趙俊博:擴散模型讓我們能直接修改Token | MEET2026

為了完整體現趙俊博的思考,在不改變原意的基礎上,量子位對演講內容進行了編輯整理,希望能給你帶來更多啟發。

MEET2026智能未來大會是由量子位主辦的行業峰會,近30位產業代表與會討論。線下到場參會觀眾近1500人,線上直播觀眾350萬+,獲得了主流媒體的廣泛關注與報道。

核心觀點梳理

  • 所有生成模型本質上都是在擬合數據分布。自回歸模型提供了一種擬合方式,它將整體分布拆解為一系列遵循單向因果順序的條件概率來逐步建模。但這種方式并不是唯一的路徑
  • 開源模型LLaDA采用擴散語言模型架構,暫不考慮MoE的情況下,在相同的計算量和性能目標下,LLaDA所需的參數規模可以比自回歸模型更小
  • 擴散架構在推理過程中可以直接修改和控制token,而不需要像自回歸模型那樣重新生成整段內容。
  • 在計算受限情況下,LLaDA采用“完形填空”式預測,相比自回歸模型更為“data-hungry”,對數據需求更大、吸收數據更快
  • LLaDA與自回歸模型的Scaling Law存在差異,已驗證LLaDA可以擴展到千億規模,但繼續往上會面臨新的挑戰。
  • ……

以下為趙俊博演講全文:

押注擴散語言模型的Scaling Law

大家好,今天我稍微講點不一樣的,來一場技術上的脫口秀。

剛才幾位嘉賓已反復提及,目前主流的大語言模型幾乎都基于自回歸架構構建。但我接下來介紹的,我們最近開源的全新系列模型——架構完全不同

要想了解不同之處何在,先讓我們來厘清幾個基本概念。

相信大家都很熟悉Midjourney、Sora、Emu Video等圖像/視頻賽道的熱門模型,實際上,它們里面都有一個非常明確的機制叫擴散

何謂擴散?簡單來說就是加噪后再去噪,從噪聲中恢復圖像。

所有的Auto-Regressive Model(AR,自回歸模型)基本都遵循同一機制——給定前N個詞,要求模型預測并生成第N+1個詞,然后基于前N+1個詞,再去預測第N+2個詞,依此類推。

而擴散語言模型另辟蹊徑,可能有些觀眾也知道這個東西叫Masked Diffusion Language Models,我們看一下它的解碼過程,簡單來說它的機制不是“做接龍”,而是“做完形填空”

如圖所示,給定一句話之后我們會Mask(遮蓋)掉一部分詞,再讓它恢復,這就非常像我們小時候做的完形填空。

跳過“逐字生成”!螞蟻集團趙俊博:擴散模型讓我們能直接修改Token | MEET2026

而我們現在要做的,就是Diffusion Language Model(dLLM,擴散語言模型)的Scaling Law。

為什么做這件事?其實這是我們的一個賭注。

本質上來說,所有的大模型只要是生成模型,都是對P(X),也就是對本身數據分布的擬合。

自回歸模型提供了一種擬合方式,它將整體分布拆解為一系列遵循單向因果順序的條件概率來逐步建模。但這種方式并不是唯一的路徑。

下圖由新加坡國立大學SEA AI研究員Jinjie Ni提供,里面點明了幾個非常重要的觀點。

第一,在計算受限的情況下,基于“完形填空”這一方式進行預測的擴散語言模型,比一般的自回歸模型需要的數據量更大,即所謂的“data-hungry”,在數據上能吃得更快。

跳過“逐字生成”!螞蟻集團趙俊博:擴散模型讓我們能直接修改Token | MEET2026

第二,同樣是dense結構(先不管MoE),在參數和計算量相同的情況下,其實dLLM可以做得比AR更小。

所謂的“Super Data Learners”,如果了解圖像或視頻的擴散模型就會知道,它們有個特點——你可以一直訓練

比如我們現在所有的自回歸模型,基本上訓練到多個epoch,效果就不再變動,數據也就這樣了。

而在同樣數據集、同樣架構下,紅色那條代表Diffusion的曲線可以一直訓——跟圖像領域觀測到的現象一致,確實可以一直做訓練。

跳過“逐字生成”!螞蟻集團趙俊博:擴散模型讓我們能直接修改Token | MEET2026

第三是Diffusion獨有的優勢。都知道CoT(思維鏈)和RL(強化學習),或者說見識過DeepSeek上的深度思考過程。這個東西我之前做了個比喻,AR像一個不能帶草稿紙的考生:

進了考場之后不允許寫提綱,跟下棋一樣落子無悔,在解所有題的時候落筆無悔。寫下一個token就釘死,再寫下一個,沒有給你任何機會回頭修改。中間寫錯了有一個CoT的機制,就好像“突然有一個token說這個地方好像中間有一步算錯了,我再重新開始”。

實際上這就解釋了為什么會有test-time scaling——AR在推理側的token efficiency其實并不高,有一些簡單的問題也要推理很久,生成很多token。

如圖所示,我們正在進行的研究叫Editable and Controllable Generation(等待跑通中),是指在Diffusion框架下,隨時“做完形填空”、隨時改;不像DeepSeek-R1或OpenAI-o1必須整段token推倒重來,我們可以直接在推理過程里改token。

跳過“逐字生成”!螞蟻集團趙俊博:擴散模型讓我們能直接修改Token | MEET2026

這個東西有大量的工程細節,時間關系我只能簡單放一些。

發布并開源千億規模dLLM

首先是注意力掩碼(Attention Mask)的適配問題

我們的模型中既包含細粒度的Block,也包含由Block組成的更大區塊——區塊之間采用自回歸的注意力機制(確保序列的總體連貫性),區塊內部并行解碼(以提升計算效率)。

因此,模型中同時存在兩種注意力模式。有些地方用全局Attention(以捕捉長程依賴),有些地方用Causal Attention(以維持自回歸約束)。

這里頭還包括對隨機長度序列的處理、集成港大孔令鵬老師提出的幾何加權方法,以及實現文本與文檔的長序列切分注意力等關鍵技術。

我們開源了一套訓練框架和推理框架,讓社區能把我們在Hugging Face上發布的模型直接跑起來。其中涉及5D并行集成、分區塊Diffusion下的Flex-Attention與Attention Mask適配,細節不再展開。

這是我們開源的第一個面向擴散語言模型的訓練框架,已支持SFT(監督微調)與DPO(直接偏好優化)。

跳過“逐字生成”!螞蟻集團趙俊博:擴散模型讓我們能直接修改Token | MEET2026

這里我想把整個脈絡稍微介紹一下:

中國人民大學文繼榮和李崇軒老師團隊,率先開源了擴散語言模型LLaDA的第一個版本LLaDA 1.0。

LLaDA 1.0的研究過程非常痛苦,當時訓練和推理框架都很原始,踩坑無數,不過其8B版本在Hugging Face上零推廣就拿到二十幾萬下載。

這是第一個大規模訓練到80億參數的擴散語言模型,效果可對標LLaMA-3-8B。

后來螞蟻技術研究院聯合人大、浙大、西湖大學把整條線接過來,下重注要把這個領域的一些“非共識”變成“共識”。

第一件事就是解決架構問題。LLaDA是一個dense模型,而dense的痛點大家都提過,比如第一個就是怎么在Diffusion的框架里集成MoE。

今年9月,我們發布了LLaDA-MoE,總參數7B(激活參數1B),是全球第一個原生訓練出來的MoE架構擴散語言模型。

最近一段時間,相關研究幾乎已經在全球鋪開——谷歌有Gemini Diffusion、有家美國創業公司在做Mercury系列,包括字節也在做。

其最大特點就是一個字:

因為它就是“做完形填空”。比如做一個解碼,我先把最后一個token解出來,然后再去填中間,這些東西確實是實際解碼過程中能看到的。

上上周,我們發布了LLaDA 2.0,率先把擴散語言模型做到千億體量。踩坑史太長,技術報告已上線,這里就不再展開。

跳過“逐字生成”!螞蟻集團趙俊博:擴散模型讓我們能直接修改Token | MEET2026

這里有幾個視頻。

第一個視頻表明,在全局注意力機制的支持下,擴散模型在效果上相比自回歸模型具備一定優勢。

跳過“逐字生成”!螞蟻集團趙俊博:擴散模型讓我們能直接修改Token | MEET2026

轉到Coding,現在比較神奇的一點是——擴散語言模型在“調用”和“寫代碼”這兩個任務上比自回歸模型有明顯優勢

得益于并行解碼,一次能同時吐出幾個token,現場看起來就像你在Cursor里按Tab自動補全。這些行為全是模型自己學出來的,我們也沒完全搞懂為啥。

跳過“逐字生成”!螞蟻集團趙俊博:擴散模型讓我們能直接修改Token | MEET2026

以及再看文學創作,這個東西比較有意思。看一下這個解碼過程,先把開頭和結尾的框架定下來,中間部分先寫個大概,然后再根據上下文反復修改、潤色中間的內容。

跳過“逐字生成”!螞蟻集團趙俊博:擴散模型讓我們能直接修改Token | MEET2026

這種“非共識”的解碼軌跡,在Gemini、OpenAI等任何原生App里都看不到。

接下來的一兩個月,我們會聯合ZenMux(一站式模型接入平臺)放出部分API,體量雖還比不過主流大模型,但社區已在慢慢長大。

dLLM的訓練推理仍處于早期發展階段

最后用一點時間聊下推理。

10月份左右,我們發布了一個帶有試驗性質的推理引擎dInfer

通過新的模型架構與范式,若能將關鍵場景的TPS推上千量級,實現五倍乃至更高的速度提升,其體驗將是革命性的。

回頭看,Data/Parameter Scaling Law已不新鮮,去年9月OpenAI又帶出testing-time Scaling Law。

接下來會不會出現Diffusion Scaling Law?

今天沒人能給出答案。唯一確定的是,dLLM與AR的Scaling Law有很大區別,繼續擴展下去也會面臨新的挑戰。

但不管怎樣,我們會在這條路上繼續走下去。在我看來,AR發展了三年(從ChatGPT出來之后發展了三年),dLLM的訓推生態才剛起步,希望社區一起下場共建,謝謝。

版權所有,未經授權不得以任何形式轉載及使用,違者必究。
天天干天天干天天操| 成人精品水蜜桃| 久久er99精品| 国产精品99久久久| 丁香婷婷深情五月亚洲| 亚洲国产精品久久久久秋霞蜜臀 | 午夜精品美女自拍福到在线| 日韩欧美www| 亚洲精品一区二区三区香蕉| 久久精品成人一区二区三区| 欧美激情视频一区二区三区不卡| 一道本无吗dⅴd在线播放一区 | 杨钰莹一级淫片aaaaaa播放| 国产一区二区电影| 成人午夜在线播放| 国产资源在线一区| 日韩欧美精品网站| 欧美中文在线观看| 中文字幕第4页| 国产精品久99| 欧美激情一二区| 久久免费国产视频| 国产精品国模大尺度私拍| 国产高清精品一区二区三区| 欧美精品久久久久| 亚洲国产精品国自产拍av秋霞| 在线观看免费91| 欧美一级二级三级| 伊人天天久久大香线蕉av色| 黄色av免费在线播放| 欧美精品在欧美一区二区| 九色91popny| 欧美性猛交xxxxx免费看| 中文字幕第28页| 狠狠人妻久久久久久综合蜜桃| 日本道在线视频| 欧美一级视频免费在线观看| 欧美日韩午夜影院| 国产精品高潮呻吟| 日本欧美一区二区三区| 久久亚洲AV无码| 日韩精品――色哟哟| 中文字幕日韩一区二区三区 | 一区二区视频免费| 国产欧美精品aaaaaa片| 久久久免费观看| 国产精品私人自拍| 久久国产精品第一页| 久久亚洲AV无码| 无遮挡又爽又刺激的视频 | 中文字幕在线不卡| 九九九国产视频| 中文字幕成人一区| 欧美一级在线播放| 91精品国产一区二区人妖| 欧美国产日韩一二三区| 国产福利免费视频| 蜜臀av粉嫩av懂色av| 亚洲午夜激情| 欧美大片在线观看一区| 国产精品视频一二| 欧美bbbbbbbbbbbb精品| 欧美日韩综合久久| 成人久久久久久久| 欧美日韩精品二区第二页| 亚洲成在人线免费| 老**午夜毛片一区二区三区| 日韩中文字幕电影| 国产91精品入口17c| 国内外成人免费激情在线视频| 香蕉久久一区二区不卡无毒影院 | 亚洲天堂网站在线| 中文字幕国产在线观看| 亚洲黄网站在线观看| 91黑丝在线观看| 天堂av8在线| 免费亚洲电影在线| 亚洲国产精品一区二区久| 影音先锋在线亚洲| 国产美女www| 色香蕉久久蜜桃| 高清不卡日本v二区在线| 亚洲精品91在线| 日本一区二区久久| 国产精品免费一区豆花| 人妻少妇无码精品视频区| 国产日韩高清在线| 国产精品99蜜臀久久不卡二区 | 国产精品久久久久影院| 日韩免费观看在线观看| 国精产品一区二区三区| 国产日韩精品久久久| 国产乱人伦真实精品视频| 欧美激情久久久久久久| 国产精品国产三级国产| 亚洲一区美女视频在线观看免费| 内射一区二区三区| 亚洲午夜免费视频| 亚洲一区二区三区成人在线视频精品| 欧美a级片免费看| 亚洲一区精品在线| 日韩欧美第二区在线观看| 国产精品尤物视频| 欧美白人最猛性xxxxx69交| 成年人网站国产| 美国毛片一区二区| 久久久久国产精品一区| 日韩精品无码一区二区三区久久久 | 久操视频在线观看免费| 亚洲综合视频在线观看| 欧美日韩免费观看一区| 99久久国产免费| 中文一区二区视频| 午夜一区二区三区免费| 亚洲欧美一区二区三区孕妇| 久久精品国产综合精品| 日韩美女视频网站| 日韩美女视频在线| 国产真人无码作爱视频免费| 91丝袜高跟美女视频| yy111111少妇影院日韩夜片| 欧美三级午夜理伦| 精品av综合导航| 少妇性l交大片7724com| 亚洲色图在线播放| 一区二区三区四区视频在线| 久久精品欧洲| 欧洲午夜精品久久久| 日韩精品视频免费看| 欧美精品一区二区三区很污很色的| 国产又黄又猛又粗又爽的视频| kk眼镜猥琐国模调教系列一区二区| 成人写真福利网| 国产成人久久精品77777综合| 精品国产一区av| 国产三级国产精品国产国在线观看| 欧美日韩一本到| 日韩成人精品视频在线观看| 日韩理论片中文av| 成年丰满熟妇午夜免费视频| 成人深夜在线观看| 久久香蕉综合色| 色婷婷av一区二区三区之e本道| 孩xxxx性bbbb欧美| www.国产毛片| 欧美激情国产日韩精品一区18| www.av免费| 亚洲精品久久久久久久久久久久 | 99re8在线精品视频免费播放| 成人黄动漫网站免费| 日韩**一区毛片| 欧美一级视频一区二区| 中文字幕免费高清网站| 欧美大片免费观看| 中文字幕在线播| 99热这里只有精品9| 欧美日韩免费做爰视频| 婷婷激情综合网| 中文字幕无码不卡免费视频| 亚洲欧洲日韩女同| www.日本三级| 国产精品久久久久久久久免费丝袜| 天天干天天色天天爽| 久久久www免费人成精品| 国内精品一区二区| 国产精品一级在线| 亚洲三级一区| 中文字幕精品—区二区四季| 成年人深夜视频| 亚洲免费色视频| 精品999在线| 在线日韩一区二区| 伊是香蕉大人久久| 国产精品中文欧美| 成人一区二区免费视频| 欧美日韩黄色大片| 亚洲999一在线观看www| 欧美无人区码suv| 欧美精品一区男女天堂| 黑人狂躁日本娇小| 日韩在线观看免费全| 国产又黄又粗又爽| 7m精品福利视频导航| 天天舔天天干天天操| 国产精品免费在线播放| 99re视频精品| 欧美一级日本a级v片| 国产人成亚洲第一网站在线播放| 国产乱子伦农村叉叉叉| 欧美日韩中文字幕| 蜜桃av免费看| 最近2019中文字幕mv免费看| 中文字幕av片| 国产精品久久久久久久天堂第1集| 国产不卡高清在线观看视频| 日本精品久久久久久久久久| 欧美日韩国产麻豆| 亚洲精品电影院| 欧美激情手机在线视频 | 激情成人中文字幕| 精品国产人妻一区二区三区| 亚洲欧美日韩中文视频| 五月婷婷丁香在线| 成人女人免费毛片| 日本一区二区三区dvd视频在线| 青青草av网站| 亚洲第一页自拍| 亚洲中文字幕一区二区| 欧美大香线蕉线伊人久久国产精品| 久久久久99精品国产片| 亚洲午夜激情影院| 精品亚洲一区二区| 国产www视频| 五月天色一区| 精品国产精品自拍| 久久久久香蕉视频| 欧美在线激情| 日韩乱码一区二区| 一级 黄 色 片一| 国产日韩av网站| 中文字幕人妻一区| 国产原创剧情av| 看黄色录像一级片| 草视频在线观看| 国产精品久久无码| 亚洲精品无码国产| 成人免费高清完整版在线观看| 色妞欧美日韩在线| 欧美一区二区网站| 国产精品人妖ts系列视频| 日本少妇xxxxx| 9l视频自拍9l视频自拍| 午夜欧美大片免费观看| 亚洲影院高清在线| 日本一级淫片演员| 国产成人综合一区二区三区| 77777亚洲午夜久久多人| 久久精品国产一区| 奇米影视一区二区三区小说| 免费在线视频观看| 国产精品999在线观看| 台湾佬中文在线| 中文在线免费观看| 成人av在线资源| 欧美sm美女调教| 国产精品视频大全| 免费在线黄网站| 成人国产精品久久久网站| 国产精品www爽爽爽| 一级免费黄色录像| 色男人天堂av| 日韩av片专区| 亚洲一区视频在线播放| 91杏吧porn蝌蚪| 国产情侣在线视频| 免费在线观看日韩av| 异国色恋浪漫潭| 欧美日韩成人一区二区三区 | 国产在线视频综合| www.中文字幕在线| 午夜欧美一区二区三区免费观看| 欧洲亚洲国产日韩| 亚洲国产精品推荐| 久久久999精品免费| 欧美日韩一区综合| 鲁大师私人影院在线观看| 91国产精品一区| 国产精品视频免费看| 亚洲韩国日本中文字幕| 国产日韩专区在线| 日韩在线视频在线| 久久久久久久久久久久久国产精品 | 欧美性一二三区| 国产精品久久久久桃色tv| 国产网红主播福利一区二区| 亚洲福利视频一区| 深夜福利一区二区| 午夜精品视频在线| 久久天堂国产精品| 中文字幕无码精品亚洲35| 国产精品一区二区三区观看| 性金发美女69hd大尺寸| 国产91视频一区| 香港三日本8a三级少妇三级99| 国产精品suv一区二区69| 久久麻豆一区二区| 国产噜噜噜噜久久久久久久久| 午夜男人的天堂| 国产a精品视频| 久久中文字幕视频| 亚洲中文字幕无码不卡电影| 亚洲美女高潮久久久| 伊人免费在线观看高清版| 国产又黄又粗又硬| 欧美日韩一区二区在线播放| 欧美日本国产一区| 欧美在线不卡区| 日韩av电影免费观看高清| 久久艳片www.17c.com| aaa级精品久久久国产片| 少妇一晚三次一区二区三区| 国产精品一级视频| 不卡电影一区二区三区| 国产精品成人一区二区艾草| 日韩一区二区在线观看| 99在线免费观看视频| 超碰97国产在线| 一级黄色片播放| 欧美日韩偷拍视频| 国产美女久久久久| 亚洲男人av在线| 欧美国产视频一区| 国产又黄又大又爽| 色欧美片视频在线观看 | 欧美成人在线免费视频| 色噜噜一区二区| jizz18女人高潮| 蜜桃av鲁一鲁一鲁一鲁俄罗斯的| 94色蜜桃网一区二区三区| 中文字幕国产精品一区二区| 欧美日韩大陆一区二区| 亚洲性线免费观看视频成熟| 国产精品视频免费观看| 日韩一级片av| 国产精品第四页| 亚洲精美色品网站| 欧美一区二区视频在线| 美女福利视频在线观看| 91丨porny丨蝌蚪视频| 久久99精品视频| 欧美另类变人与禽xxxxx| 国产亚洲欧美一区二区 | 国产一区二区美女视频| 成人看片视频| 在线不卡av电影| 青草国产精品久久久久久| 色婷婷综合激情| 欧美日韩精品免费观看| 91香蕉国产视频| 国产精品全国免费观看高清| 精品乱人伦小说| 99视频在线免费观看| 精品人妻一区二区三区免费| 国产情侣一区二区| 在线免费精品视频| 91九色蝌蚪国产| 91丝袜在线观看| 老司机午夜精品| 色综合老司机第九色激情| 男男做爰猛烈叫床爽爽小说 | 亚洲图片欧美午夜| 天天爽天天爽夜夜爽| 美腿丝袜一区二区三区| 91精品国产一区二区三区动漫| 免费av一级片| 国产尤物99| 久久99九九99精品| 国产精品日韩在线| 综合网在线观看| 日韩免费电影一区| 四虎精品欧美一区二区免费| 久久精品www人人爽人人| 亚洲人成影院在线观看| 久久精品人成| 亚洲aaa在线观看| 日韩亚洲第一页| 国产又黄又猛的视频| 全国男人的天堂网| 日韩高清人体午夜| 久久国产亚洲精品无码| 丝袜国产日韩另类美女| 尤物yw午夜国产精品视频| 天天综合成人网| 红桃av永久久久| 午夜激情福利在线| 色老汉av一区二区三区| 精品日韩欧美| 成人免费看片98| 91精品国产色综合久久不卡电影| 日韩亚洲一区在线播放| 一卡二卡在线视频| 欧美视频一区在线| 久久久久天天天天| 久草手机在线观看| 欧美成人一级视频| 性欧美丰满熟妇xxxx性久久久| 欧美综合天天夜夜久久| 日韩视频第二页| 色综合久久中文综合久久97| 国产大片中文字幕| 97伦理在线四区| 亚洲一区二区黄色| 久久久久亚洲AV| 热门国产精品亚洲第一区在线| 国产精品91xxx| 国产资源在线免费观看| 懂色av一区二区在线播放| 正在播放亚洲| 黄页视频在线91| 亚洲欧洲日韩综合二区| 91一区二区三区在线观看| 一区二区三视频| 成人动漫精品一区二区| 免费高清一区二区三区| 中文字幕欧美日本乱码一线二线| 国产精品美女黄网| 久久久久国产精品一区二区| 成人网页在线免费观看| 久久er99精品| 免费中文日韩|