色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

跳過“逐字生成”!螞蟻集團趙俊博:擴散模型讓我們能直接修改Token | MEET2026

dLLM的訓練推理仍處于早期發展階段

當主流大語言模型還在采用自回歸架構時,有人已經盯上了擴散架構。

在本次量子位MEET2026智能未來大會上,浙江大學百人計劃研究員、博士生導師,螞蟻集團資深技術專家趙俊博表示:

擴散架構在推理過程中可以直接修改和控制token,而不需要像自回歸模型那樣重新生成整段內容。

這意味著,相比自回歸模型,擴散模型理論上有望實現更快的生成速度以及更低的計算成本。

基于此,他和團隊將重點押注于擴散架構,并致力于探索擴散語言模型獨有的Scaling Law。

而作為這一探索的關鍵里程碑,他們近期發布并開源了LLaDA 2.0,率先將擴散語言模型做到千億體量

趙俊博坦言,該領域在訓練與推理層面仍處早期,但發展勢頭迅猛,已吸引包括谷歌、字節在內的巨頭及一批初創公司積極布局。

編者注:就在MEET2026智能未來大會結束后,趙俊博和團隊也發布了全新的技術報告,揭示了千億體量擴散語言模型背后的關鍵技術選擇。
報告標題:LLaDA2.0: Scaling Up Diffusion Language Models to 100B
報告鏈接(github):https://github.com/inclusionAI/LLaDA2.0/blob/main/tech_report.pdf

跳過“逐字生成”!螞蟻集團趙俊博:擴散模型讓我們能直接修改Token | MEET2026

為了完整體現趙俊博的思考,在不改變原意的基礎上,量子位對演講內容進行了編輯整理,希望能給你帶來更多啟發。

MEET2026智能未來大會是由量子位主辦的行業峰會,近30位產業代表與會討論。線下到場參會觀眾近1500人,線上直播觀眾350萬+,獲得了主流媒體的廣泛關注與報道。

核心觀點梳理

  • 所有生成模型本質上都是在擬合數據分布。自回歸模型提供了一種擬合方式,它將整體分布拆解為一系列遵循單向因果順序的條件概率來逐步建模。但這種方式并不是唯一的路徑
  • 開源模型LLaDA采用擴散語言模型架構,暫不考慮MoE的情況下,在相同的計算量和性能目標下,LLaDA所需的參數規模可以比自回歸模型更小
  • 擴散架構在推理過程中可以直接修改和控制token,而不需要像自回歸模型那樣重新生成整段內容。
  • 在計算受限情況下,LLaDA采用“完形填空”式預測,相比自回歸模型更為“data-hungry”,對數據需求更大、吸收數據更快
  • LLaDA與自回歸模型的Scaling Law存在差異,已驗證LLaDA可以擴展到千億規模,但繼續往上會面臨新的挑戰。
  • ……

以下為趙俊博演講全文:

押注擴散語言模型的Scaling Law

大家好,今天我稍微講點不一樣的,來一場技術上的脫口秀。

剛才幾位嘉賓已反復提及,目前主流的大語言模型幾乎都基于自回歸架構構建。但我接下來介紹的,我們最近開源的全新系列模型——架構完全不同

要想了解不同之處何在,先讓我們來厘清幾個基本概念。

相信大家都很熟悉Midjourney、Sora、Emu Video等圖像/視頻賽道的熱門模型,實際上,它們里面都有一個非常明確的機制叫擴散

何謂擴散?簡單來說就是加噪后再去噪,從噪聲中恢復圖像。

所有的Auto-Regressive Model(AR,自回歸模型)基本都遵循同一機制——給定前N個詞,要求模型預測并生成第N+1個詞,然后基于前N+1個詞,再去預測第N+2個詞,依此類推。

而擴散語言模型另辟蹊徑,可能有些觀眾也知道這個東西叫Masked Diffusion Language Models,我們看一下它的解碼過程,簡單來說它的機制不是“做接龍”,而是“做完形填空”

如圖所示,給定一句話之后我們會Mask(遮蓋)掉一部分詞,再讓它恢復,這就非常像我們小時候做的完形填空。

跳過“逐字生成”!螞蟻集團趙俊博:擴散模型讓我們能直接修改Token | MEET2026

而我們現在要做的,就是Diffusion Language Model(dLLM,擴散語言模型)的Scaling Law。

為什么做這件事?其實這是我們的一個賭注。

本質上來說,所有的大模型只要是生成模型,都是對P(X),也就是對本身數據分布的擬合。

自回歸模型提供了一種擬合方式,它將整體分布拆解為一系列遵循單向因果順序的條件概率來逐步建模。但這種方式并不是唯一的路徑。

下圖由新加坡國立大學SEA AI研究員Jinjie Ni提供,里面點明了幾個非常重要的觀點。

第一,在計算受限的情況下,基于“完形填空”這一方式進行預測的擴散語言模型,比一般的自回歸模型需要的數據量更大,即所謂的“data-hungry”,在數據上能吃得更快。

跳過“逐字生成”!螞蟻集團趙俊博:擴散模型讓我們能直接修改Token | MEET2026

第二,同樣是dense結構(先不管MoE),在參數和計算量相同的情況下,其實dLLM可以做得比AR更小。

所謂的“Super Data Learners”,如果了解圖像或視頻的擴散模型就會知道,它們有個特點——你可以一直訓練

比如我們現在所有的自回歸模型,基本上訓練到多個epoch,效果就不再變動,數據也就這樣了。

而在同樣數據集、同樣架構下,紅色那條代表Diffusion的曲線可以一直訓——跟圖像領域觀測到的現象一致,確實可以一直做訓練。

跳過“逐字生成”!螞蟻集團趙俊博:擴散模型讓我們能直接修改Token | MEET2026

第三是Diffusion獨有的優勢。都知道CoT(思維鏈)和RL(強化學習),或者說見識過DeepSeek上的深度思考過程。這個東西我之前做了個比喻,AR像一個不能帶草稿紙的考生:

進了考場之后不允許寫提綱,跟下棋一樣落子無悔,在解所有題的時候落筆無悔。寫下一個token就釘死,再寫下一個,沒有給你任何機會回頭修改。中間寫錯了有一個CoT的機制,就好像“突然有一個token說這個地方好像中間有一步算錯了,我再重新開始”。

實際上這就解釋了為什么會有test-time scaling——AR在推理側的token efficiency其實并不高,有一些簡單的問題也要推理很久,生成很多token。

如圖所示,我們正在進行的研究叫Editable and Controllable Generation(等待跑通中),是指在Diffusion框架下,隨時“做完形填空”、隨時改;不像DeepSeek-R1或OpenAI-o1必須整段token推倒重來,我們可以直接在推理過程里改token。

跳過“逐字生成”!螞蟻集團趙俊博:擴散模型讓我們能直接修改Token | MEET2026

這個東西有大量的工程細節,時間關系我只能簡單放一些。

發布并開源千億規模dLLM

首先是注意力掩碼(Attention Mask)的適配問題

我們的模型中既包含細粒度的Block,也包含由Block組成的更大區塊——區塊之間采用自回歸的注意力機制(確保序列的總體連貫性),區塊內部并行解碼(以提升計算效率)。

因此,模型中同時存在兩種注意力模式。有些地方用全局Attention(以捕捉長程依賴),有些地方用Causal Attention(以維持自回歸約束)。

這里頭還包括對隨機長度序列的處理、集成港大孔令鵬老師提出的幾何加權方法,以及實現文本與文檔的長序列切分注意力等關鍵技術。

我們開源了一套訓練框架和推理框架,讓社區能把我們在Hugging Face上發布的模型直接跑起來。其中涉及5D并行集成、分區塊Diffusion下的Flex-Attention與Attention Mask適配,細節不再展開。

這是我們開源的第一個面向擴散語言模型的訓練框架,已支持SFT(監督微調)與DPO(直接偏好優化)。

跳過“逐字生成”!螞蟻集團趙俊博:擴散模型讓我們能直接修改Token | MEET2026

這里我想把整個脈絡稍微介紹一下:

中國人民大學文繼榮和李崇軒老師團隊,率先開源了擴散語言模型LLaDA的第一個版本LLaDA 1.0。

LLaDA 1.0的研究過程非常痛苦,當時訓練和推理框架都很原始,踩坑無數,不過其8B版本在Hugging Face上零推廣就拿到二十幾萬下載。

這是第一個大規模訓練到80億參數的擴散語言模型,效果可對標LLaMA-3-8B。

后來螞蟻技術研究院聯合人大、浙大、西湖大學把整條線接過來,下重注要把這個領域的一些“非共識”變成“共識”。

第一件事就是解決架構問題。LLaDA是一個dense模型,而dense的痛點大家都提過,比如第一個就是怎么在Diffusion的框架里集成MoE。

今年9月,我們發布了LLaDA-MoE,總參數7B(激活參數1B),是全球第一個原生訓練出來的MoE架構擴散語言模型。

最近一段時間,相關研究幾乎已經在全球鋪開——谷歌有Gemini Diffusion、有家美國創業公司在做Mercury系列,包括字節也在做。

其最大特點就是一個字:

因為它就是“做完形填空”。比如做一個解碼,我先把最后一個token解出來,然后再去填中間,這些東西確實是實際解碼過程中能看到的。

上上周,我們發布了LLaDA 2.0,率先把擴散語言模型做到千億體量。踩坑史太長,技術報告已上線,這里就不再展開。

跳過“逐字生成”!螞蟻集團趙俊博:擴散模型讓我們能直接修改Token | MEET2026

這里有幾個視頻。

第一個視頻表明,在全局注意力機制的支持下,擴散模型在效果上相比自回歸模型具備一定優勢。

跳過“逐字生成”!螞蟻集團趙俊博:擴散模型讓我們能直接修改Token | MEET2026

轉到Coding,現在比較神奇的一點是——擴散語言模型在“調用”和“寫代碼”這兩個任務上比自回歸模型有明顯優勢

得益于并行解碼,一次能同時吐出幾個token,現場看起來就像你在Cursor里按Tab自動補全。這些行為全是模型自己學出來的,我們也沒完全搞懂為啥。

跳過“逐字生成”!螞蟻集團趙俊博:擴散模型讓我們能直接修改Token | MEET2026

以及再看文學創作,這個東西比較有意思。看一下這個解碼過程,先把開頭和結尾的框架定下來,中間部分先寫個大概,然后再根據上下文反復修改、潤色中間的內容。

跳過“逐字生成”!螞蟻集團趙俊博:擴散模型讓我們能直接修改Token | MEET2026

這種“非共識”的解碼軌跡,在Gemini、OpenAI等任何原生App里都看不到。

接下來的一兩個月,我們會聯合ZenMux(一站式模型接入平臺)放出部分API,體量雖還比不過主流大模型,但社區已在慢慢長大。

dLLM的訓練推理仍處于早期發展階段

最后用一點時間聊下推理。

10月份左右,我們發布了一個帶有試驗性質的推理引擎dInfer

通過新的模型架構與范式,若能將關鍵場景的TPS推上千量級,實現五倍乃至更高的速度提升,其體驗將是革命性的。

回頭看,Data/Parameter Scaling Law已不新鮮,去年9月OpenAI又帶出testing-time Scaling Law。

接下來會不會出現Diffusion Scaling Law?

今天沒人能給出答案。唯一確定的是,dLLM與AR的Scaling Law有很大區別,繼續擴展下去也會面臨新的挑戰。

但不管怎樣,我們會在這條路上繼續走下去。在我看來,AR發展了三年(從ChatGPT出來之后發展了三年),dLLM的訓推生態才剛起步,希望社區一起下場共建,謝謝。

版權所有,未經授權不得以任何形式轉載及使用,違者必究。
国产91丝袜在线观看| 亚洲激情图片qvod| 亚洲制服丝袜在线| 日韩一区二区电影网| 午夜美女久久久久爽久久| 国内一区在线| 欧美激情国内自拍| 国产精品男女视频| 粉嫩13p一区二区三区| 欧美午夜片在线免费观看| 久久高清视频免费| 日韩av电影免费在线| 在线观看视频你懂得| 亚洲图片欧美日韩| 久久久久久**毛片大全| 欧美tk—视频vk| 国产精品综合网站| 日本一道本久久| 国产精品久久久免费看| 蜜乳av一区二区三区| 色综合久久久久综合体| 久久久免费观看视频| 在线国产伦理一区| 天海翼在线视频| 日本不卡视频在线| 欧美在线视频不卡| 国产成人鲁鲁免费视频a| 99精品在线免费视频| 国产一级免费av| 成人精品鲁一区一区二区| 欧美一级二级三级蜜桃| 成人av资源网| 成人精品在线观看视频| 日本不卡视频在线观看| 欧美亚洲高清一区二区三区不卡| 国产精品白嫩初高中害羞小美女 | 亚洲精品视频在线观看免费视频| 久久99精品网久久| 日韩欧美成人一区二区| 精品国产一区二区三区日日嗨| 亚洲少妇中文字幕| 免费看欧美美女黄的网站| 在线播放一区二区三区| 99在线视频播放| 五月开心播播网| 麻豆精品在线观看| 日韩午夜中文字幕| 你懂的网址一区二区三区| 亚洲第一成人网站| 国产大陆精品国产| 这里只有精品丝袜| 黄色www网站| 一区二区三区黄| 精品国产户外野外| 亚洲aa中文字幕| 无码人妻aⅴ一区二区三区| 久久精品国产精品亚洲综合| 亚洲国产美女精品久久久久∴| 日本一区二区精品视频| 国产亚洲精品码| 亚洲欧美一区二区三区国产精品 | 97人妻精品一区二区三区| 亚洲免费高清视频在线| 国产精品老牛影院在线观看| 亚洲成a人片在线www| 黄网站免费久久| 精品国产1区二区| 亚洲精品偷拍视频| 伊人久久成人网| 欧美色中文字幕| 久草精品电影| 亚洲黄色三级视频| 午夜精品视频一区| 国产日韩欧美精品| 国产性生活网站| 亚洲18色成人| 极品日韩久久| 综合激情网五月| 色网站国产精品| 欧美日韩一区二区三区在线观看免| 精品97人妻无码中文永久在线| 最新成人av在线| 91在线看www| 91视频综合网| 亚洲不卡在线观看| 欧美精品v日韩精品v国产精品| 好吊妞视频一区二区三区| 狠狠躁夜夜躁久久躁别揉| 久久精品日韩精品| 中文字幕欧美人妻精品| 欧美一区二区三区视频免费播放| 久操手机在线视频| 丝袜国产日韩另类美女| xxxx性欧美| 在线免费看黄色片| 久久久久国产成人精品亚洲午夜| 国产欧美 在线欧美| 欧美日韩免费做爰视频| 色噜噜狠狠成人网p站| 一区二区三区视频| 香蕉视频免费在线看| 色婷婷**av毛片一区| 9191在线视频| 国产精品久久久久久久久久久免费看 | 少妇高潮惨叫久久久久| 一区二区三区在线免费观看| 蜜桃av色综合| 国产又黄又猛又爽| 亚洲精品少妇网址| 丰满饥渴老女人hd| 亚洲欧美激情插| 日韩一区二区三区高清| 亚洲大尺度网站| 北条麻妃在线一区二区| 国产精品无码永久免费不卡| 亚洲一区在线看| 肉大捧一出免费观看网站在线播放| 视频一区在线播放| 国产成人97精品免费看片| 亚欧视频在线观看| 亚洲黄色www| 白嫩情侣偷拍呻吟刺激| 福利视频第一区| 日韩欧美视频网站| 久久久久久久精| 欧美一区二区三区四区夜夜大片 | 人成网站在线观看| 欧美日韩成人在线播放| 真实国产乱子伦对白在线| 日韩午夜精品电影| 香蕉视频1024| 欧美性xxxx极品hd欧美风情| 久久久久久久久久久久久久国产| 久久午夜羞羞影院免费观看| 日本精品国语自产拍在线观看| 久久国产日韩| 国产免费一区二区三区在线观看| 亚洲综合精品在线| 久久久久久久久久久免费 | 91亚洲国产成人精品一区| 中文字幕av一区| 成人自拍小视频| 亚洲成人国产精品| 人妻无码一区二区三区免费| 7878成人国产在线观看| 免费看91视频| 欧美色图天堂网| 91人人澡人人爽| 在线视频国内一区二区| 国产老头和老头xxxx×| 在线观看网站黄不卡| 成人免费黄色av| 色哟哟一区二区在线观看| 日韩av影视大全| 亚洲国产美女搞黄色| 午夜两性免费视频| 色综合天天在线| 韩国三级hd两男一女| 在线91免费看| 黄色片网站免费| 亚洲精品美女久久久| 91狠狠综合久久久| 日韩中文字幕视频在线| 天天干在线播放| 97视频人免费观看| 亚洲老妇色熟女老太| 国产日韩在线亚洲字幕中文| 久久婷婷av| 欧美日韩一区二区视频在线观看| 成年人国产精品| 激情五月六月婷婷| 亚洲福利一区二区| 蜜桃视频无码区在线观看| 欧美一区二区三区在线电影| 欧美xxxooo| 精品自拍视频在线观看| 亚洲av永久无码国产精品久久| 91中文在线视频| 成人免费毛片aaaaa**| 国产天堂视频在线观看| 五月综合激情日本mⅴ| 超碰caoprom| 国产亚洲人成网站在线观看| www.国产毛片| 成人免费网站在线| 风间由美性色一区二区三区| 国产一二三在线视频| 色悠久久久久综合欧美99| 欧美日韩精品系列| 亚洲美女激情视频| 国产福利小视频| 五月婷婷之婷婷| 久久久久亚洲综合| 国产无遮无挡120秒| 国产男人精品视频| 亚洲国产精彩中文乱码av在线播放| 欧美日韩一区二区不卡| 日韩免费视频一区| 一本色道久久综合亚洲91| 欧美性感一类影片在线播放| 麻豆精品精品国产自在97香蕉| 日韩成人av一区二区| 2019av中文字幕| 欧美综合久久久| 国产成人精品免费视频网站| 免费日韩一级片| 57pao精品| 午夜精品久久久久久久| 成人免费福利片| 亚洲精品无码久久久| 中文字幕人妻熟女在线| 精品视频在线播放色网色视频| 日韩精品一二三四区| 欧美在线看片a免费观看| 一区二区三区欧美日| 91视频最新入口| 国产一区二区三区黄| 国模精品系列视频| 久久91亚洲精品中文字幕奶水| 国内精品视频一区| 国产在线视频2019最新视频| 91免费国产网站| 艳母动漫在线观看| 亚洲一区二区精品在线| 国产精品一区在线播放| 欧美一区二区三区视频免费播放| 亚洲视频免费看| 国产高清精品网站| 香港三日本三级少妇66| 999在线观看视频| 欧美最近摘花xxxx摘花| 久久亚洲一区二区三区四区五区高 | 羞羞的视频在线| 亚洲第一色中文字幕| 精品国产乱码久久久久久影片| 欧美日韩在线直播| 日韩久久久久久| 亚洲三级av在线| 欧美高清在线观看| 91影视免费在线观看| 精品无人国产偷自产在线| 91麻豆精品国产91久久久久| 色悠悠久久综合| 精品亚洲夜色av98在线观看| 在线亚洲欧美专区二区| 91免费观看在线| 国产精品无码专区av在线播放| 午夜精品福利在线观看| 欧美成人中文字幕在线| 日韩成人在线网站| 亚洲激情视频在线播放| 国产精品成人免费| 蜜臀av性久久久久蜜臀aⅴ| 中文字幕乱码视频| 国产在线麻豆精品观看| 日韩欧美999| 亚洲高清不卡在线观看| 亚洲成人免费av| 欧美精品一区二区在线观看| 国产精品亚洲视频| 伦av综合一区| 国产成人午夜99999| 91欧美一区二区| 精品国产免费人成电影在线观看四季 | 久久超级碰视频| 久久精品视频免费在线观看| 国产熟女一区二区丰满| 丰满人妻一区二区三区无码av| 国产高清免费av| 久久网一区二区| 欧美三级小视频| 国产黄在线免费观看| 久久久久免费看| 久久久久国产精品麻豆| 色噜噜狠狠成人网p站| 91精品蜜臀在线一区尤物| 777国产偷窥盗摄精品视频| 亚洲一区二区三区乱码| 久久影院资源网| 国产精品电影观看| 日本一区二区视频| 亚洲激情视频在线播放| 2021国产精品视频| 国产av人人夜夜澡人人爽麻豆| 妖精视频一区二区| 久久av高潮av无码av喷吹| 日韩免费观看一区二区| 凹凸精品一区二区三区| 久久婷婷影院| 一卡二卡欧美日韩| 国产欧美日韩亚州综合 | 一级片免费观看视频| 91久色porny| 在线精品视频一区二区| 91精品国产一区| 久久久久久久香蕉| 成人中心免费视频| 日韩一区二区高清视频| 欧美福利在线视频| 麻豆一区二区三| 日韩免费视频一区| 在线观看成人av电影| 亚洲天堂中文在线| 4438亚洲最大| 伊人再见免费在线观看高清版| 国产chinesehd精品露脸| 精品一区二区无码| 黑人操亚洲女人| 一区二区三区在线视频播放| 久久国产精品视频| 91在线高清视频| 人人妻人人添人人爽欧美一区| 尤物在线免费视频| 国产av无码专区亚洲a∨毛片| 自拍偷拍国产精品| 亚洲欧美国产视频| 欧美激情第99页| 精品国产二区在线| 日韩a一级欧美一级| 国产在线一区二区| 91精品国产91久久| 亚洲高清在线免费观看| 亚洲熟女www一区二区三区| 不卡区在线中文字幕| 在线国产精品视频| 欧美aaa在线观看| 久久99久久99精品蜜柚传媒| 一区二区三区久久久久| 久久在线免费观看| 久久露脸国产精品| 久久久久99精品| 亚洲国产精品福利| 懂色av蜜桃av| 日韩精品一区国产麻豆| 亚洲国产综合av| 亚洲免费在线视频一区 二区| 国产伦精品一区二区三区照片91| 亚洲图片综合网| 91丨九色丨蝌蚪丨老版| 亚洲日本成人网| 少妇被狂c下部羞羞漫画| 国产原创一区二区| 性色av一区二区三区免费| 国产探花视频在线| 成人免费视频网站在线观看| 欧美吞精做爰啪啪高潮| 精品免费国产| 国产裸体永久免费无遮挡| 亚洲人成网站色ww在线| 日韩国产精品一区二区| 国产精品无码粉嫩小泬| 精品国产乱码久久久久久浪潮| 亚洲av无日韩毛片久久| 成人午夜av影视| 色哟哟一区二区| 亚洲精品国产一区| www.天堂在线| 亚洲片国产一区一级在线观看| 911亚洲精选| 亚洲影院在线观看| av在线播放天堂| 天天综合在线视频| 欧美日韩色一区| 欧美一区二区三区四区夜夜大片| 国产福利视频导航| 久久视频在线播放| 韩国无码一区二区三区精品| 欧美日韩中文字幕日韩欧美| 欧美精品一区免费| 三级欧美在线一区| 日韩精品在线私人| 欧美 日韩 国产 激情| 国产在线精品一区二区| 欧美亚洲伦理www| 亚洲国产精品一区二区久久hs| 国产精品麻豆久久久| 日韩黄色影视| 久久精品30| 91久久久久久久一区二区| 国产又粗又猛视频| 精品国产一区二区在线| 国产成人精品a视频一区| 日韩精品自拍偷拍| 九九热精品免费视频| 久久久999成人| av观看在线免费| 亚洲xxxx在线| 成人久久视频在线观看| 伊人久久大香线蕉成人综合网| 视频一区欧美精品| 国产 高清 精品 在线 a| 精品乱码一区内射人妻无码| 久久69精品久久久久久国产越南| www.啪啪.com| 精品久久久久久久人人人人传媒| 亚洲香蕉中文网| 精品日韩欧美一区二区| 日本高清免费在线视频| 亚洲成a人在线观看| 激情网站五月天| 一区二区三区四区高清精品免费观看| 公肉吊粗大爽色翁浪妇视频| 亚洲免费精彩视频| 成人av网站在线播放| 欧美俄罗斯乱妇| 51国产偷自视频区视频| 国产日韩中文在线| 69视频免费看| 国产成人亚洲综合91| 美女精品一区|