色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

AI解數學題只靠最后一個token

大語言模型在解數學題時,真正的計算發生在哪里?

henry 發自 凹非寺

量子位 | 公眾號 QbitAI

大語言模型在解心算題時,只依賴最后一個token?

AI解數學題只靠最后一個token

最近,來自加州大學圣克魯茲分校、喬治·梅森大學和Datadog的研究人員發現:在心算任務中,幾乎所有實際的數學計算都集中在序列的最后一個token上完成,而不是分散在所有token中。

這意味著,相較于在Transformer和多層感知機(MLP)中常見的全局信息訪問——即每個token在預測時都能查詢并利用整個上文信息——在諸如心算這樣的特定任務中,全局訪問其實并不是必需的。

這是怎么一回事?

心算只要最后一個token?!

總的來說,研究人員采用了上下文感知平均消融(Context-Aware Mean Ablation, CAMA)基于注意力的窺視(attention-based peeking)技術對Llama-3-8B等Transformer架構的模型進行了一系列的消融實驗。

這些實驗通過系統性地移除或改變模型的一部分,探究能讓模型依然表現良好的“最少計算量”

在這一過程中,研究人員發現模型內部會形成一個稀疏子圖(sparse subgraph)——他們把它稱為“人人為我”(All-for-One, AF1)。

這個子圖通過最少的計算層和最有限的信息傳遞,讓模型高效完成運算。

AI解數學題只靠最后一個token

在“人人為我”中,輸入Transformer前幾層(L_wait)的token并沒有做跟“自己數值”相關的計算,而是“等待”,并主要承擔一些通用的準備工作(比如識別token、結構編碼、預測下一步所需的通用表示)。

然后,在中間的兩層(L_transfer)里,它們就將信息傳遞給最后一個token。

之后,最后一個token獨自完成計算并給出答案。

這一過程表明,模型內部將任務通用型計算(如 token 識別、數值與結構編碼)與輸入特定型計算(如實際算術運算)是分開的。

(注:這篇研究聚焦于心算任務,即涉及兩個或三個操作數的算術問題(例如42+20?15),這些問題可以通過單個token的輸出解決,而無需模型進行顯式的鏈式思維推理。)

接下來,我們具體來看。

眾所周知,大語言模型在許多計算任務上表現出色,而其中一個重要原因是其采用了Transformer架構。

與RNN不同,Transformer允許任意token通過自注意力機制立即訪問所有先前的token以傳遞信息,并使每個token能夠通過多層感知機(MLP)并行執行各自的獨立計算。

但即便如此,模型內部的信息流和計算過程仍然是不透明的。

因此,為了揭開大語言模型的“黑箱”,研究人員采用了以下三個步驟來進行探索。

首先,在模型的初始層抑制token針對特定輸入的計算

研究人員發現,在傳統Transformer的每一層中,token都能訪問所有之前的token,但對于簡單的心算任務,每個token可能未必從一開始就要獲得全局信息。

由此,研究人員引入了等待期(L_wait):讓在前面的L_wait層中的token獨立計算,只執行任務通用操作(如理解數字、識別算術結構),而不訪問其他token。

AI解數學題只靠最后一個token

為了實現這一點,他們使用了上下文感知平均消融(CAMA)

CAMA的作用是屏蔽掉token之間的輸入特定信息,同時保留每個token的普遍計算能力,使模型能夠在不依賴具體輸入的情況下完成基礎準備工作。

AI解數學題只靠最后一個token

接下來,在少數幾層中限制跨token位置的信息傳遞路徑。只讓最后token在L_transfer層中訪問所有token,其余層只關注自己。

最后,在剩余的層中強制所有計算都在最后一個token上發生

由于CAMA只能從第一層開始,因此,研究人員引入了一種可以在任意層控制信息訪問的方法——基于注意力的窺視(ABP)

它通過修改注意力掩碼(attention mask),精確指定每個“查詢”(query)token可以關注哪些“鍵”(key)。

在這篇論文中,研究人員主要使用了以下兩種模式:

  • 完全窺探 (Full-peeking): token可以關注所有在它之前的token,這是標準的因果注意力。在AF1的傳遞階段,最后一個token使用此模式來收集信息。
  • 自我窺探 (Self-peeking): token只能關注它自己,在傳遞和計算階段,所有非末尾的token都使用此模式;在計算階段,最后一個token也切換到此模式。

實驗驗證

在完成方法和操作流程的構建后,研究者進行了一系列實驗來發現、驗證和分析AF1子圖。這里主要涉及到Llama-3-8B和Llama-3.1-8B,以及在Pythia和GPT-J模型上的驗證。

首先,通過三階段消融與窺視實驗,研究人員發現Llama-3-8B在A+B+C任務中只需前14層做任務通用計算(CAMA 層),然后通過2層信息傳輸讓最后的token獲取全局信息,剩余層僅進行最后token的自計算。

AI解數學題只靠最后一個token

這個幾乎保留全部性能的子圖被命名為AF1_llama

接下來,研究人員又進一步驗證了AF1_llama在Llama-3-8B和Llama-3.1-8B上的表現。

實驗表明,AF1_llama在八個任務中總體表現出高忠實度。

AI解數學題只靠最后一個token

更進一步,實驗進一步驗證了第15和16層的信息傳輸在Llama-3-8B中的重要性。

研究表明,僅少數注意力頭對算術計算關鍵,即使移除近60個頭部,模型仍能保持約95%的準確率,表明大部分注意力頭冗余,而關鍵頭集中在少數層。

AI解數學題只靠最后一個token

此外,為了探究AF1_llama是否可以在Llama-3-8B上泛化到表示A+B和A?B運算的其他算術形式,研究進一步將口頭描述運算以及將運算嵌入到應用題或Python代碼中。

實驗表明,AF1_llama在不包含額外語義上下文的直接算術任務中仍保持了相當高的準確率。

然而,它在需要語義理解的任務上,如應用題和Python代碼,完全失敗了,這表明它需要額外的組件來處理其他能力,比如理解自然語言或Python程序輸入。

AI解數學題只靠最后一個token

最后,研究人員在Pythia和GPT-J中也發現了類似AF1的子圖,但與Llama不同,這些模型的等待期更短(L_wait ≈ 9–11)、信息傳輸層更長,且性能邊界不如Llama清晰。

盡管忠實度普遍低于Llama,但對二元運算任務的子圖仍能恢復超過一半的原始模型準確率。

AI解數學題只靠最后一個token

總體而言,這項工作為大語言模型中的算術推理和跨token計算的機制理解做出了貢獻。此外,它通過CAMA和ABP提供了方法論上的創新,可服務于算術任務之外的更廣泛應用。

參考鏈接

[1]https://x.com/rohanpaul_ai/status/1966788202238448101

[2]https://www.arxiv.org/pdf/2509.09650AI解數學題只靠最后一個token

版權所有,未經授權不得以任何形式轉載及使用,違者必究。
国产色产综合色产在线视频| 免费视频一区二区| 日av在线不卡| 欧美精品久久96人妻无码| 久久亚洲精品欧美| 国产又大又黄又粗又爽| 久操视频免费在线观看| 日韩福利电影在线| 亚洲午夜免费福利视频| 日韩亚洲欧美成人| 欧美激情第一页在线观看| 亚洲一区二区中文字幕在线观看| 国产精品久久久免费视频| 国产精品亚洲第一| 欧美另类高清zo欧美| 日本精品一区二区三区在线| 日韩美女爱爱视频| 极品颜值美女露脸啪啪| 激情国产一区二区| 欧美一激情一区二区三区| 国产日韩在线精品av| www黄色av| 亚洲黄色免费观看| 中文字幕成人av| 中文字幕亚洲综合久久| 视频一区亚洲| 久草视频手机在线| 成人毛片老司机大片| 欧美精品一区二区三区很污很色的 | 成年人视频大全| 国产美女福利视频| 91精品国产乱码久久久久久久久 | 中文字幕中文字幕一区| 亚洲精品视频在线播放| 国产成人免费在线观看视频| 91精品国产一区二区| 欧美日韩成人免费视频| 国产精品久久影院| 欧美午夜精品久久久久久蜜| 日韩国产高清在线| 亚洲剧情一区二区| 神马久久久久久久| 黄色在线观看av| 亚洲日韩欧美视频| 久久成人久久鬼色| 精品国产免费久久久久久婷婷| 国产精品资源网| 成年人性生活视频| …久久精品99久久香蕉国产| 欧美精品一区二区三| 亚洲一区二区三区在线| 99视频精品在线| 亚洲狼人综合网| 色一情一乱一伦一区二区三区日本 | 中文字幕免费一区| 巨乳女教师的诱惑| 色偷偷久久人人79超碰人人澡| 亚洲午夜精品久久久久久人妖| 日韩av三级在线观看| 日韩在线视频第一页| 91午夜在线观看| 国产丝袜精品视频| 波多野结衣电影免费观看| 国产福利视频一区二区| 欧美美女激情18p| chinese全程对白| 国产精品久久国产精品| 51精品免费网站| 91在线云播放| 亚洲a∨一区二区三区| 在线观看国产精品一区| 欧美在线观看一区二区| 亚洲视频在线免费播放| 欧美在线视频二区| 欧美性生活影院| 精品一区二三区| 精品乱码一区| 欧美香蕉大胸在线视频观看 | www.久久色.com| 国产美女久久久久| 亚洲激情图片网| 午夜免费在线观看精品视频| 国产精品亚洲专一区二区三区| 三级男人添奶爽爽爽视频| 久久久久国产精品www| 日韩黄色一级片| 一区二区成人国产精品| 米仓穗香在线观看| 97色在线播放视频| 日本久久精品电影| 99国产精品99久久久久久| 少妇高潮喷水久久久久久久久久| 5858s免费视频成人| 国产成人三级在线播放| 亚洲综合在线中文字幕| 日本一区二区不卡在线| 高清欧美电影在线| 免费看日本毛片| 在线成人高清不卡| 日韩一级中文字幕| 久久精品老司机| 国产伦精品一区二区三毛| 一区二区激情视频| 亚洲免费在线观看av| 蜜桃日韩视频| 9191国产精品| 国产在线不卡一区| 全部毛片永久免费看| 五月天综合视频| 亚洲国产综合久久| 91影院在线播放| 免费观看国产视频| 丁香六月天婷婷| а天堂中文在线资源| 日韩高清av电影| 国产精品中文字幕久久久| 亚洲天堂开心观看| 久久综合五月天婷婷伊人| 国产精品成人免费一区二区视频| 91精产国品一二三| 韩国女同性做爰三级| 欧美黑人在线观看| 日韩高清中文字幕| 91视频你懂的| 欧美第一黄网| 91啪九色porn原创视频在线观看| 又黄又爽又色的视频| 日韩成人免费在线| 亚洲图片第一页| 91激情视频在线| 亚洲精品不卡| 97超级碰在线看视频免费在线看| 欧美日韩亚洲一区二| 国产91精品久久久久久久网曝门| 日韩在线观看第一页| 狠狠干狠狠操视频| 欧美xxxx吸乳| 日本免费高清一区二区| 亚洲一区高清| 日韩成人在线视频网站| 日韩免费视频一区二区| 在线免费观看一区| 中文字幕日韩在线视频| 国产精品久久久久av| 欧美大黑帍在线播放| 色噜噜狠狠永久免费| 欧美熟妇一区二区| 免费a级黄色片| 欧美成人一区二区在线观看| 黄色一级片黄色| 国产免费裸体视频| 国产精品theporn88| 国内精品久久久久久中文字幕| 欧美偷拍一区二区| 亚洲精品一区二区三区四区| 亚洲国产精品影视| 中文在线不卡视频| 日韩av片在线免费观看| 国产在线精品成人一区二区三区| 日韩在线国产精品| 日韩精品在线一区二区| 欧美伊人久久大香线蕉综合69| 国产精品一区二区免费不卡| 欧美成人一区二区视频| 91精产国品一二三产区别沈先生| 日韩免费电影一区二区| 91精品国产91久久久久| 亚洲成人免费av| 亚洲激情一二三区| 在线视频日韩精品| 中文字幕av一区二区| 国产精品视频xxxx| 久久另类ts人妖一区二区| 亚洲字幕在线观看| 国产成一区二区| 日韩高清在线播放| 天天干天天干天天干天天干天天干| 黄色大全在线观看| 国产欧美va欧美不卡在线| 欧美黄色免费网站| 伊人网在线免费| 欧美精品一区二区蜜桃| 日本中文字幕一区二区视频| 99久久夜色精品国产网站| 在线视频1卡二卡三卡| 波多野结衣一二区| 日本午夜激情视频| 国产黑人绿帽在线第一区| 亚洲午夜精品久久久久久性色| 五月婷婷激情在线| 日韩福利在线视频| 黑人操日本美女| 香蕉视频一区二区| 中文字幕日韩第一页| 久久久久久久久黄色| 日韩精品在线不卡| 日本高清www免费视频| 人人干人人干人人干| 在线观看黄网站| 久久久久99精品成人片毛片| 日韩激情在线观看| 欧美激情综合网| 亚洲成人av资源网| 日韩一区二区电影在线| 91成人在线精品| 色偷偷av一区二区三区| 日本成人在线不卡| 国产jk精品白丝av在线观看 | 久久中文字幕精品| 中文字幕第28页| 国产传媒视频在线| 国产99久一区二区三区a片 | 久久视频在线直播| 国产高清视频一区三区| 国产一区欧美二区三区| 久久69精品久久久久久国产越南| 亚洲成人精品一区| 亚洲精品乱码久久久久| 五月天欧美精品| 天天操精品视频| 麻豆亚洲av熟女国产一区二| 99久久精品无免国产免费| 国产成a人亚洲| 色香色香欲天天天影视综合网| 欧美日韩国产高清一区二区| 中文字幕精品av| 成人深夜直播免费观看| 一区二区三区四区五区精品 | 丁香婷婷久久久综合精品国产 | 不卡电影一区二区三区| 欧美一区在线视频| 色综合一区二区| 91久久久久久久久久久| 一女被多男玩喷潮视频| 成人午夜福利视频| 97不卡在线视频| 欧美超碰在线观看| 亚洲人成电影网站色…| 少妇高潮喷水在线观看| 韩国三级电影一区二区| 亚洲欧洲国产伦综合| 国产传媒欧美日韩| 女女调教被c哭捆绑喷水百合| 五月天中文字幕| 国产精品九色蝌蚪自拍| 91在线短视频| 自拍偷拍亚洲色图欧美| 一区二区三区久久久久| 久久精品av麻豆的观看方式| 91av在线看| 欧美第一页在线观看| 国产成a人亚洲精| 在线观看成人黄色| 国产原创精品在线| 国产精彩视频在线观看| aaa欧美色吧激情视频| 久久久久久久久国产| 欧美肉大捧一进一出免费视频| 中文字幕一区二区三区色视频| 亚洲精品中文字幕乱码三区不卡| 亚洲男人第一天堂| 久久99精品久久久久久噜噜| 青青青国产在线观看| 四季av中文字幕| 国产精品天天看| 精品国产九九九| 亚洲视频一区二区免费在线观看| 国产乱色国产精品免费视频| 国产欧美精品一区二区色综合朱莉 | 久久久久国产精品麻豆ai换脸 | 在线免费看v片| 午夜18视频在线观看| 欧美日本一区二区三区四区| 欧美日韩精品中文字幕一区二区| 欧美肥妇bbwbbw| 99精品国产视频| 久久九九免费视频| 欧美成人三级在线播放| 欧美成人精品欧美一级乱黄| 国产精品久久久一本精品| 欧美一级片久久久久久久| 欧美一区免费观看| 亚洲欧美日韩精品久久| 黄色国产在线播放| 亚洲视频小说图片| 国产精品欧美日韩一区二区| 国产伦精品一区二区三区视频网站| 亚洲日本中文字幕在线| 色狠狠桃花综合| 日韩av一区二区三区在线| 好吊视频一二三区| 亚洲视频在线观看| 91香蕉在线视频| 国内成人精品视频| 精品伊人久久久久7777人| 国产熟女高潮视频| 欧美特黄级在线| 欧美福利第一页| 98精品国产自产在线观看 | 日本三级小视频| 亚洲免费电影在线观看| xxxx日本免费| 亚洲另类在线制服丝袜| 午夜精品短视频| 成人国产精品免费观看视频| 久热精品在线视频| 一区二区三区四区免费| 亚洲成人a**站| 亚洲欧美日韩国产yyy| 国产一级18片视频| 3d动漫精品啪啪1区2区免费| 国产婷婷成人久久av免费高清| 2023亚洲男人天堂| 久久久久人妻一区精品色欧美| 欧美一级欧美三级| 日本r级电影在线观看| 一区二区三区欧美日| 亚洲精品高清国产一线久久| 亚洲系列在线观看| 波多野结衣一区二区三区| 78m国产成人精品视频| 亚洲一区二区自偷自拍| 亚洲欧美日韩国产综合| 免费日韩电影在线观看| 91极品身材尤物theporn| 日韩视频免费在线| 九九热这里有精品视频| 色婷婷综合久久久久中文一区二区| 色哟哟免费网站| 国产女主播一区| 色99中文字幕| 精品久久久久久中文字幕大豆网| 国产免费无遮挡吸奶头视频| 亚洲护士老师的毛茸茸最新章节| 亚洲av无码一区二区三区网址| 中文字幕一区二区三区在线不卡| 久久久性生活视频| 亚洲精品男人的天堂| 欧美日韩国产一二三| 日本三级免费观看| 一区二区三区高清不卡| 国产精品va无码一区二区| 欧美日韩国产精品一区二区| 成人禁用看黄a在线| 亚洲一区二区三区乱码| 欧美—级在线免费片| 国产熟人av一二三区| 欧美少妇xxx| 男人女人拔萝卜视频| 黑人精品xxx一区| 日本美女高潮视频| 色综合咪咪久久| 国产精品果冻传媒| 欧美高清视频在线高清观看mv色露露十八| 国产色视频在线播放| 亚洲国产成人porn| 一卡二卡三卡四卡| 国产v综合ⅴ日韩v欧美大片| 韩国av在线免费观看| 国产精品入口日韩视频大尺度| av一二三不卡影片| 亚洲成人激情小说| 视频在线观看99| 成人精品gif动图一区| 日韩欧美一级视频| 69久久久久久| 久久国产成人午夜av影院| 男人日女人bb视频| 91色琪琪电影亚洲精品久久| 精品久久久久久中文字幕一区奶水| 91黄色在线视频| 91福利视频免费观看| 欧美大尺度激情区在线播放| 激情文学综合插| 国产黄色大片免费看| 欧美丰满老妇厨房牲生活| 99久久精品一区二区| 国产又黄又猛又粗又爽的视频| 亚洲欧洲一区二区三区久久| 五月激情婷婷网| 久久综合久久网| 亚洲精品一区二区三区香蕉| 日韩精品一区二区三区国语自制| 日本sm极度另类视频| 91丨porny丨户外露出| 三级在线免费看| 日韩欧美在线不卡| 91精东传媒理伦片在线观看| 91深夜福利视频| 成人久久视频在线观看| 亚洲色图欧美另类| 国产精品美女主播| 欧美激情一区二区三区在线| 国产日韩亚洲欧美在线| 亚洲欧美日本韩国| 911国产在线| 国产欧美精品一区二区三区| 五月婷婷另类国产| 中文字幕在线欧美| www.亚洲成人网| 久久久久久国产精品美女| 国产清纯在线一区二区www| 欧美爱爱小视频| 青草网在线观看| 久久久久北条麻妃免费看| 欧美国产综合一区二区| 2021亚洲天堂| 日韩高清国产一区在线观看| 精品国产免费视频| 蜜臀av一级做a爰片久久|