色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

華為新架構(gòu)砍了Transformer大動脈!任意模型推理能力原地飆升

而且還不增加參數(shù)量

金磊 發(fā)自 凹非寺

量子位 | 公眾號 QbitAI

是時候給Transformer的大動脈動刀子了。

因為即便它享有當下AI世界基石的地位,但自身問題也是非常明顯:

一旦遇到復雜的數(shù)學題或者需要多步邏輯推理的時候,就開始一本正經(jīng)地胡說八道了……

華為新架構(gòu)砍了Transformer大動脈!任意模型推理能力原地飆升

問題究竟出在了哪里?

答案就藏在Transformer的核心機制里——Attention

傳統(tǒng)Attention機制本質(zhì)上像是一種配對比較:每個詞只和另一個詞直接發(fā)生關(guān)系,生成一個注意力權(quán)重。

這種架構(gòu)雖然擅長捕捉長距離依賴,但在建模復雜、多跳、多點之間的邏輯關(guān)系時卻顯得力不從心了。

例如它能輕松理解“A認識B”,但如果要它理解“張三通過李四認識了王五”,即多跳、多點之間的復雜、間接關(guān)系,它的腦回路就顯得不夠深,推理能力的天花板瞬間觸頂。

現(xiàn)在,這個天花板,被華為諾亞方舟實驗室捅破了!

因為就在最近,團隊祭出了一種全新架構(gòu),叫做Nexus,即高階注意力機制(Higher-Order Attention Mechanism)。

華為新架構(gòu)砍了Transformer大動脈!任意模型推理能力原地飆升

它可以說是直接狙擊了Attention機制的核心痛點,使用更高階注意力,就能有效地建模多跳、多點之間的復雜關(guān)聯(lián)。

并且從實驗結(jié)果來看,效果也是有點驚艷在身上的。

只要換上Nexus這個新架構(gòu),模型在數(shù)學和科學等復雜推理任務(wù)上的能力,都能立馬實現(xiàn)大幅飆升,而且還是參數(shù)零增的那種。

妙哉,著實妙哉。

接下來,就讓我們一同來深入了解一下Nexus的精妙一刀。

高階注意力機制砍出的精妙一刀

要理解高階的意義,我們必須先回顧傳統(tǒng)自注意力機制的根本缺陷。

標準的自注意力機制本質(zhì)上是將輸入序列X分別通過三個線性變換WQ,WK,WV生成Query(Q)、Key(K)、Value(V),再通過softmax計算注意力權(quán)重:

華為新架構(gòu)砍了Transformer大動脈!任意模型推理能力原地飆升

但這里就出現(xiàn)了一個關(guān)鍵的問題:Q和K都是靜態(tài)的、與上下文無關(guān)的線性投影。

也就是說,某個token的Query向量僅由它自己決定,無法感知其他token的存在;這導致注意力權(quán)重只能反映兩兩之間的直接關(guān)系。

精妙第一刀:Q和K的革新

華為諾亞方舟實驗室的第一個刀法,就精妙地砍在了這里:Nexus讓Q和K的生成過程本身也變成一個注意力操作。

換句話說,token在計算最終的Q和K之前,會先進行一次“預(yù)推理”;這個過程,其實就是一個嵌套的自注意力機制

Token首先通過這個內(nèi)部循環(huán),從全局上下文中聚合信息,形成一個更加精煉、更具上下文感知能力的表示,然后再用這個表示去計算最終的Q和K。

這就好比,在你問我答(Q和K計算Attention)之前,每個token都先在內(nèi)部進行了深思熟慮,充分吸收了它在整個序列中的環(huán)境信息。

這樣生成的Q和K,自然就擺脫了線性投影的僵硬,具備了捕捉復雜關(guān)系的動態(tài)性。

華為新架構(gòu)砍了Transformer大動脈!任意模型推理能力原地飆升

精妙第二刀:巧用遞歸框架

Nexus架構(gòu)最精妙之處,還在于它的遞歸框架(Recursive Framework)。

這個內(nèi)部注意力循環(huán)可以被遞歸地來嵌套。

如果我們將一層Attention視為一階關(guān)系(A認識B),那么將Attention的輸出作為下一層Attention的輸入,就可以構(gòu)建二階關(guān)系(張三通過李四認識王五),乃至更高階的關(guān)系。

在Nexus中,這種遞歸嵌套被巧妙地集成在一個單層結(jié)構(gòu)中,形成了一個層次化的推理鏈。

論文進一步將上述過程遞歸化,定義第m階注意力為:

華為新架構(gòu)砍了Transformer大動脈!任意模型推理能力原地飆升

其中,m=1就是標準注意力;m=2表示Q和K由一次內(nèi)層注意力生成;m=3表示Q和K由二階注意力生成,相當于“注意力的注意力的注意力”。

這種結(jié)構(gòu)天然支持多跳推理鏈,就像人在解一道數(shù)學題時,先理解題干中的關(guān)鍵變量(第1層),再思考它們之間的公式關(guān)系(第2層),最后驗證整體邏輯是否自洽(第3層)。

精妙第三刀:不增參數(shù)

復雜架構(gòu)往往意味著更高的計算開銷和更多的參數(shù)量,但Nexus通過精巧的設(shè)計,完全規(guī)避了這些問題——權(quán)重共享策略

具體來說,無論是內(nèi)層還是外層的注意力模塊,都復用同一組投影權(quán)重WQ,WK,WV。

這意味著,盡管計算路徑更復雜,但模型參數(shù)量和原始Transformer完全一致。

這種設(shè)計背后有一個關(guān)鍵假設(shè):無論處于遞歸的哪一層,將token投影為Query或Key的語義變換方式是相似的。

團隊通過實驗證明,這一假設(shè)是成立的。

華為新架構(gòu)砍了Transformer大動脈!任意模型推理能力原地飆升

在Pythia-70M的消融實驗中,使用權(quán)重共享的Nexus-QK-Shared版本,平均準確率仍比基線高出近1個百分點,而參數(shù)量毫無增加。

這就讓Nexus成為了一種極其高效的表達密度提升器——用相同的參數(shù),實現(xiàn)更強的推理能力。

只要換上Nexus,推理效果立竿見影

那么Nexus的效果到底如何?

論文在兩個維度做了驗證:從零訓練的小模型,以及對已有大模型的架構(gòu)改造。

小模型全面領(lǐng)先

研究團隊在 Pythia 系列(70M 到 1B)上從頭訓練 Nexus,并在六個標準推理數(shù)據(jù)集上評估:ARC-C、ARC-E、HellaSwag、LogiQA、PiQA和SciQ。

結(jié)果非常一致:Nexus 在所有規(guī)模上都優(yōu)于原始Transformer。

尤其在需要多步推理或科學常識的任務(wù)中提升顯著。例如:

  • 在SciQ(科學問答)上,70M模型準確率從61.5%提升至68.5%,提升7個百分點;
  • 在PiQA(物理常識推理)上,1B模型從62.5%提升至63.6%。
華為新架構(gòu)砍了Transformer大動脈!任意模型推理能力原地飆升

這說明Nexus特別擅長處理那些不能靠表面模式匹配解決的問題,是真的有在做推理。

大模型改裝即用

面對規(guī)模更大的模型,Nexus還體現(xiàn)出了即插即用的能力。

團隊將Qwen2.5的1.5B和7B版本的標準注意力層直接替換為Nexus結(jié)構(gòu),僅在SFT(監(jiān)督微調(diào))階段進行訓練,未改動預(yù)訓練權(quán)重。

結(jié)果表明,在三個高難度數(shù)學推理基準上(MATH-500、AIME24、GPQA-Diamond),Nexus 均帶來穩(wěn)定提升:

  • Qwen2.5-1.5B在MATH-500上準確率從78.6% → 80.1%;
  • Qwen2.5-7B在AIME24上從 45.2% → 47.5%。
華為新架構(gòu)砍了Transformer大動脈!任意模型推理能力原地飆升

尤其值得注意的是AIME24的提升,因為這類題目要求嚴格的多步邏輯推導,錯誤一步就全盤皆輸。Nexus 的改進說明,它確實在內(nèi)部構(gòu)建了更連貫的推理鏈。

從這一層面來看,Nexus不僅是一個新訓練范式,還是一套架構(gòu)升級套件。你不用重新訓練一個千億模型,只需在微調(diào)階段替換注意力層,就能解鎖更強的推理能力。

推理能力可內(nèi)生于架構(gòu)

雖然Nexus目前聚焦于語言模型,但其思想具有普適性。

高階關(guān)系建模在視覺、圖神經(jīng)網(wǎng)絡(luò)、多模態(tài)任務(wù)中同樣關(guān)鍵;例如,在視頻理解中,“A看到B打了C” 就是一個典型的三元關(guān)系,傳統(tǒng)Attention難以直接捕捉。

華為諾亞團隊表示,下一步將探索Nexus在視覺Transformer和多模態(tài)大模型中的應(yīng)用,并優(yōu)化其計算效率。

Transformer 的智商天花板,或許從來不在參數(shù)量,而在其注意力機制的表達能力。華為諾亞的 Nexus,用一種優(yōu)雅而高效的方式,為這一核心模塊注入了高階推理能力。

它不靠堆料,不靠提示工程,而是從架構(gòu)底層重構(gòu)了模型的思考方式。

因此,Nexus也提醒了我們:有時候,聰明的架構(gòu)比規(guī)模的大小更重要。

論文地址:
https://arxiv.org/abs/2512.03377

版權(quán)所有,未經(jīng)授權(quán)不得以任何形式轉(zhuǎn)載及使用,違者必究。
国产酒店精品激情| 亚洲欧美精品| 国产日本欧美一区| 国产精品爽爽ⅴa在线观看| 国产精品久久久久久久久影视| 国产精品成人一区二区| 亚洲精品免费av| 久草精品电影| 三年中文高清在线观看第6集 | 9久草视频在线视频精品| 91在线播放网址| 欧美国产综合一区二区| 亚洲一本大道在线| 欧美在线免费播放| 日韩高清免费观看| 欧美精品生活片| 国产精品网站入口| 日韩av电影免费在线观看| 99精品一区二区三区的区别| av视屏在线播放| 亚洲久久久久久| 国产无码精品久久久| 不卡视频免费在线观看| 国内久久婷婷综合| 亚洲美女淫视频| 欧美一级黄色片| 不卡av电影院| 成人免费黄色网| 国产美女视频免费| 无码国产精品久久一区免费| 日韩在线中文字幕视频| ,亚洲人成毛片在线播放| 美女一区二区三区| 亚洲人成小说网站色在线| 欧美日韩国产一级| 久久久久久亚洲综合| 国产揄拍国内精品对白| 久久国产精品国语对白| 日韩黄色一级视频| 久久最新视频| 最新中文字幕一区二区三区 | 97免费中文视频在线观看| 国产伦精品一区二区三区在线 | 日本一级大毛片a一| 国产大片aaa| 日韩国产欧美视频| 亚洲色图视频网站| 日韩电影大全免费观看2023年上| 日本精品va在线观看| 亚洲欧美日韩不卡一区二区三区| 日本人69视频| 久久精品视频7| 国产成人精品免费网站| 色天天综合色天天久久| 欧美国产亚洲精品久久久8v| 日韩欧美视频一区二区| 97人妻精品一区二区三区免费 | 成人av在线影院| 欧美三级视频在线观看| 久久久久久久影院| 国产手机视频在线观看| 免费福利视频网站| 美女诱惑黄网站一区| 亚洲男同1069视频| 日韩中文字幕在线| 日韩精品久久久毛片一区二区| 中文字幕18页| 亚洲精品中文字幕成人片| 国产精品视频一二| 色噜噜狠狠色综合网图区| 欧美韩国日本精品一区二区三区| 日韩精品――色哟哟| 亚洲一级视频在线观看| 中文字幕人成不卡一区| 精品国模在线视频| 国产盗摄视频在线观看| 成人自拍小视频| 国产成人免费视| 精品盗摄一区二区三区| 国内视频一区二区| 午夜时刻免费入口| 久久99久国产精品黄毛片色诱| 91国偷自产一区二区开放时间| 国产97在线|日韩| 亚洲一区二区黄| 免费中文日韩| 色天使在线视频| 青草国产精品久久久久久| 亚洲一区二区三区四区的| 欧美日韩不卡合集视频| 青青草成人免费在线视频| 日韩欧美三级视频| 国产精品毛片高清在线完整版| 精品国偷自产在线| 99蜜桃臀久久久欧美精品网站| 国产一级淫片a视频免费观看| 国产精品第四页| 欧美激情在线播放| 亚洲第一中文av| 欧美 日韩 人妻 高清 中文| 欧美写真视频网站| 精品国产91亚洲一区二区三区www| 国产成人福利在线| 狠狠久久亚洲欧美| 日韩二区三区在线| 一级特黄录像免费播放全99| youjizz在线视频| 图片区日韩欧美亚洲| 国产精品免费视频xxxx| 水蜜桃av无码| www.一区二区| 97精品在线观看| 精品熟女一区二区三区| 不卡视频一二三| 久久久亚洲福利精品午夜| 亚洲污视频在线观看| 久久精品国产精品亚洲精品| 日韩av在线影院| 国产主播自拍av| 手机看片一区二区| 亚洲天堂日韩电影| 男女啪啪网站视频| 韩国成人精品a∨在线观看| 另类少妇人与禽zozz0性伦| 在线免费视频a| 蜜桃视频一区二区| xxxxx成人.com| 天天看片天天操| 高清免费成人av| 日本精品视频网站| 欧美性生给视频| 亚洲成av人**亚洲成av**| 国产一区二区三区奇米久涩| a在线视频播放观看免费观看| 亚洲mv大片欧洲mv大片精品| 欧美精品一区在线| 99久久99久久久精品棕色圆| 精品中文视频在线| 奇米视频888| 26uuu精品一区二区在线观看| 日本成人免费在线| 久久久久黄色片| 欧美专区日韩专区| 免费拍拍拍网站| 五月婷婷综合久久| 日韩在线欧美在线国产在线| 超碰caoprom| 亚洲精品视频自拍| 亚洲电影网站| 日韩福利电影在线观看| 欧美成aaa人片免费看| 国产一级久久久久毛片精品| 亚洲成av人片一区二区梦乃| 欧美日韩亚洲国产成人| 久久久久国产精品一区三寸| 欧美肥婆姓交大片| 九九精品视频免费| 欧美亚洲国产一区二区三区| 免费观看美女裸体网站| 成人a免费在线看| 国产精品区一区| 99久久国产免费| 九九热99久久久国产盗摄| 国产探花在线视频| 91精品福利在线一区二区三区| 女人扒开屁股爽桶30分钟| 91蝌蚪porny九色| 欧美二区在线看| 日韩和欧美的一区| 国产噜噜噜噜噜久久久久久久久| 亚洲天堂久久久久| 欧美www在线| 特级做a爱片免费69| 伊人伊成久久人综合网站| 特级西西人体wwwww| 在线观看精品一区| 亚洲av无一区二区三区久久| 婷婷国产在线综合| 中文字幕第88页| 天天操天天干天天综合网| 别急慢慢来1978如如2| 亚洲精品亚洲人成人网| 日韩av黄色网址| 亚洲青青青在线视频| 草b视频在线观看| 欧美激情在线一区二区| 日本一区二区免费高清视频| 久久久一区二区| 欧美视频在线第一页| 日本一区二区成人在线| 国产一级不卡视频| 亚洲天天做日日做天天谢日日欢| 国产精品www在线观看| 国产精品丝袜黑色高跟| 91国视频在线| 亚洲风情在线资源站| 中文字幕亚洲影院| 欧美高清性hdvideosex| 91麻豆精品国产91久久综合| 国产丝袜一区视频在线观看 | av无码久久久久久不卡网站| 国产精品不卡在线观看| 妺妺窝人体色www在线小说| 偷窥国产亚洲免费视频| 成人免费播放视频| 欧美一区二区三区爱爱| 午夜精品一区二区三区视频| 久久精品亚洲国产| 99久久一区二区| 96久久精品| 高清在线观看日韩| 霍思燕三级露全乳照| 婷婷开心激情综合| 免费看黄色的视频| 久久久成人av| 亚洲va久久久噜噜噜无码久久| 成人av网站观看| 97成人超碰视| 成人亚洲视频在线观看| 欧美疯狂性受xxxxx喷水图片| 日韩欧美国产成人精品免费| 欧美激情亚洲国产| 久久精品人人| 久久最新免费视频| 一本一道久久a久久精品| 国产1区2区在线观看| 欧美成人激情在线| 日韩精品乱码免费| 青草视频在线观看视频| 欧美色图一区二区三区| 久草资源在线视频| 国产精品高潮呻吟久久av黑人| 国产成人亚洲精品青草天美| 日韩av一二三四| 亚洲国产欧美一区二区三区久久| 男人天堂视频在线| 精品伊人久久大线蕉色首页| 亚洲日本护士毛茸茸| 少妇一级淫免费观看| 欧美精品午夜视频| 国产乱子伦一区二区三区国色天香| 久久99中文字幕| 日韩免费在线观看| 无码任你躁久久久久久久| 国产精品swag| 亚洲午夜日本在线观看| 无码黑人精品一区二区| 国产精品人人做人人爽| 久久影视一区二区| 亚洲中文字幕一区| 97高清免费视频| 97精品视频在线观看自产线路二| 无码国产精品久久一区免费| 欧美激情伊人电影| 成人黄色在线视频| 在线天堂www在线国语对白| 欧美激情区在线播放| 成人精品免费视频| 动漫av在线免费观看| 欧美激情精品久久久| 国产91精品露脸国语对白| 污污视频在线免费| 欧美精品999| 国产日韩欧美一区二区三区乱码| 国产人妻人伦精品1国产丝袜 | 欧美性xxxxxx少妇| 国产真人无遮挡作爱免费视频| 日韩av免费电影| 777久久久精品| 亚洲精品成人电影| 十八禁视频网站在线观看| 深夜福利日韩在线看| 国产精品1区2区3区在线观看| 人妻激情偷乱频一区二区三区| 91高清视频在线免费观看| 日本一区二区免费在线观看视频| 成人免费视频入口| 91精品入口蜜桃| 日韩欧美有码在线| 91女人18毛片水多国产| 男女超爽视频免费播放| 日韩在线一区二区三区免费视频| 国产成人无遮挡在线视频| 在线视频 日韩| 91嫩草在线视频| 色一情一乱一乱一91av| 国内老熟妇对白hdxxxx| 91福利国产成人精品播放| 性欧美在线看片a免费观看| 国产精品国产自产拍在线| 日本熟妇乱子伦xxxx| 中文字幕一区二区中文字幕| 亚洲男人av在线| 成人美女视频在线看| 亚洲精品91在线| 久久精品magnetxturnbtih| 在线播放欧美女士性生活| 久久狠狠亚洲综合| 亚洲精品国产精品国自产网站| 国产日韩欧美亚洲一区| 日韩小视频在线观看专区| 国产一区二区三区不卡在线观看| 成年人在线免费看片| 欧美日韩高清免费| 一区二区三区 在线观看视| 26uuu国产电影一区二区| 日本午夜视频在线观看| 日日鲁鲁鲁夜夜爽爽狠狠视频97 | chinese少妇国语对白| 人九九综合九九宗合| 欧美性xxxxxxxxx| 久久久久国产精品午夜一区| 精品人伦一区二区三电影| 午夜精品区一区二区三| 久久久91精品| 亚洲视频一区二区在线观看| av老司机久久| 亚洲一级中文字幕| 四虎影院一区二区三区| 精品国模在线视频| 欧美日韩一区二区在线| 日本强好片久久久久久aaa| 亚洲一二三四五六区| 丰满少妇大力进入| 国产拍精品一二三| 亚洲丁香久久久| 亚洲欧美日韩国产手机在线| 欧美性受xxxx狂喷水| 亚洲精品天堂网| 女人和拘做爰正片视频| 91观看网站| 国产亚洲视频在线| 欧美日韩性视频| 成人一二三区视频| 国产精品嫩草影院桃色| 免费观看av网站| 欧美深夜福利视频| 国产欧美日韩伦理| 欧美精品久久久久| 日韩一区二区三区在线观看| 日本一区二区三区免费乱视频| 91影院在线播放| 最新中文字幕av| av视屏在线播放| 亚洲国产综合自拍| 欧美一级淫片videoshd| 午夜成人在线视频| 欧美在线激情网| 久久久久久久久久久免费精品| 日韩欧美色综合| 久久精品国产美女| 亚洲制服中文字幕| 艳妇乳肉豪妇荡乳av| 国产清纯在线一区二区www| 99久久精品国产精品久久| 一色屋精品亚洲香蕉网站| 日韩午夜激情免费电影| 亚洲最大福利视频网| 日本中文字幕免费| 欧美日韩国产一二三| 99免费在线视频观看| 2017亚洲天堂| 国产欧美一区二区三区在线老狼| 久久亚洲影音av资源网| 韩国欧美亚洲国产| 噜噜噜噜噜久久久久久91| 日本三级中文字幕| 欧美在线视频不卡| 日本在线观看一区二区| 日本不卡一区二区三区| 国产精品久久久久久久久免费 | 国产精品6699| 女尊高h男高潮呻吟| 毛片av中文字幕一区二区| 亚洲精品视频在线观看视频| 97视频资源在线观看| 日日夜夜狠狠操| 在线一区二区视频| 亚洲一区二区不卡视频| 亚洲成人黄色片| 欧美裸体一区二区三区| av一区二区三区免费| 欧美日韩偷拍视频| 怡红院av一区二区三区| 青青青在线视频播放| 国产电影一区在线| 亚洲精品永久免费| 亚洲36d大奶网| 国产欧美视频一区二区三区| 99国产在线视频| 伊人手机在线视频| 蜜臀久久久久久久| 欧美精品久久久久久久免费观看| 91精品久久久久久久久久久久| 欧美日韩一区二区三区不卡| 国产人妻互换一区二区| 在线免费观看日本欧美| 免费看一级大片| 不卡av电影院| 国产乱码一区二区| 国产福利久久| 东方aⅴ免费观看久久av| 视频一区国产精品| 天天干天天干天天干| 国外成人性视频| 国产精品国产精品88| 中文成人综合网| 在线看成人av电影| 久久亚洲欧美国产精品乐播| 欧美日韩免费高清|