亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當(dāng)前位置: 首頁(yè) ? 資訊 ? 新科技 ? 正文

AI解數(shù)學(xué)題只靠最后一個(gè)token

IP屬地 中國(guó)·北京 量子位 時(shí)間:2025-09-14 14:19:26

henry 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI

大語(yǔ)言模型在解心算題時(shí),只依賴(lài)最后一個(gè)token?



最近,來(lái)自加州大學(xué)圣克魯茲分校、喬治·梅森大學(xué)和Datadog的研究人員發(fā)現(xiàn):在心算任務(wù)中,幾乎所有實(shí)際的數(shù)學(xué)計(jì)算都集中在序列的最后一個(gè)token上完成,而不是分散在所有token中。

這意味著,相較于在Transformer和多層感知機(jī)(MLP)中常見(jiàn)的全局信息訪問(wèn)——即每個(gè)token在預(yù)測(cè)時(shí)都能查詢(xún)并利用整個(gè)上文信息——在諸如心算這樣的特定任務(wù)中,全局訪問(wèn)其實(shí)并不是必需的。

這是怎么一回事?

心算只要最后一個(gè)token?!

總的來(lái)說(shuō),研究人員采用了上下文感知平均消融(Context-Aware Mean Ablation, CAMA)基于注意力的窺視(attention-based peeking)技術(shù)對(duì)Llama-3-8B等Transformer架構(gòu)的模型進(jìn)行了一系列的消融實(shí)驗(yàn)。

這些實(shí)驗(yàn)通過(guò)系統(tǒng)性地移除或改變模型的一部分,探究能讓模型依然表現(xiàn)良好的“最少計(jì)算量”

在這一過(guò)程中,研究人員發(fā)現(xiàn)模型內(nèi)部會(huì)形成一個(gè)稀疏子圖(sparse subgraph)——他們把它稱(chēng)為“人人為我”(All-for-One, AF1)。

這個(gè)子圖通過(guò)最少的計(jì)算層和最有限的信息傳遞,讓模型高效完成運(yùn)算。



在“人人為我”中,輸入Transformer前幾層(L_wait)的token并沒(méi)有做跟“自己數(shù)值”相關(guān)的計(jì)算,而是“等待”,并主要承擔(dān)一些通用的準(zhǔn)備工作(比如識(shí)別token、結(jié)構(gòu)編碼、預(yù)測(cè)下一步所需的通用表示)。

然后,在中間的兩層(L_transfer)里,它們就將信息傳遞給最后一個(gè)token。

之后,最后一個(gè)token獨(dú)自完成計(jì)算并給出答案。

這一過(guò)程表明,模型內(nèi)部將任務(wù)通用型計(jì)算(如 token 識(shí)別、數(shù)值與結(jié)構(gòu)編碼)與輸入特定型計(jì)算(如實(shí)際算術(shù)運(yùn)算)是分開(kāi)的。

(注:這篇研究聚焦于心算任務(wù),即涉及兩個(gè)或三個(gè)操作數(shù)的算術(shù)問(wèn)題(例如42+20?15),這些問(wèn)題可以通過(guò)單個(gè)token的輸出解決,而無(wú)需模型進(jìn)行顯式的鏈?zhǔn)剿季S推理。)

接下來(lái),我們具體來(lái)看。

眾所周知,大語(yǔ)言模型在許多計(jì)算任務(wù)上表現(xiàn)出色,而其中一個(gè)重要原因是其采用了Transformer架構(gòu)。

與RNN不同,Transformer允許任意token通過(guò)自注意力機(jī)制立即訪問(wèn)所有先前的token以傳遞信息,并使每個(gè)token能夠通過(guò)多層感知機(jī)(MLP)并行執(zhí)行各自的獨(dú)立計(jì)算。

但即便如此,模型內(nèi)部的信息流和計(jì)算過(guò)程仍然是不透明的。

因此,為了揭開(kāi)大語(yǔ)言模型的“黑箱”,研究人員采用了以下三個(gè)步驟來(lái)進(jìn)行探索。

首先,在模型的初始層抑制token針對(duì)特定輸入的計(jì)算

研究人員發(fā)現(xiàn),在傳統(tǒng)Transformer的每一層中,token都能訪問(wèn)所有之前的token,但對(duì)于簡(jiǎn)單的心算任務(wù),每個(gè)token可能未必從一開(kāi)始就要獲得全局信息。

由此,研究人員引入了等待期(L_wait):讓在前面的L_wait層中的token獨(dú)立計(jì)算,只執(zhí)行任務(wù)通用操作(如理解數(shù)字、識(shí)別算術(shù)結(jié)構(gòu)),而不訪問(wèn)其他token。



為了實(shí)現(xiàn)這一點(diǎn),他們使用了上下文感知平均消融(CAMA)

CAMA的作用是屏蔽掉token之間的輸入特定信息,同時(shí)保留每個(gè)token的普遍計(jì)算能力,使模型能夠在不依賴(lài)具體輸入的情況下完成基礎(chǔ)準(zhǔn)備工作。



接下來(lái),在少數(shù)幾層中限制跨token位置的信息傳遞路徑。只讓最后token在L_transfer層中訪問(wèn)所有token,其余層只關(guān)注自己。

最后,在剩余的層中強(qiáng)制所有計(jì)算都在最后一個(gè)token上發(fā)生

由于CAMA只能從第一層開(kāi)始,因此,研究人員引入了一種可以在任意層控制信息訪問(wèn)的方法——基于注意力的窺視(ABP)

它通過(guò)修改注意力掩碼(attention mask),精確指定每個(gè)“查詢(xún)”(query)token可以關(guān)注哪些“鍵”(key)。

在這篇論文中,研究人員主要使用了以下兩種模式:

完全窺探 (Full-peeking):token可以關(guān)注所有在它之前的token,這是標(biāo)準(zhǔn)的因果注意力。在AF1的傳遞階段,最后一個(gè)token使用此模式來(lái)收集信息。自我窺探 (Self-peeking):token只能關(guān)注它自己,在傳遞和計(jì)算階段,所有非末尾的token都使用此模式;在計(jì)算階段,最后一個(gè)token也切換到此模式。

實(shí)驗(yàn)驗(yàn)證

在完成方法和操作流程的構(gòu)建后,研究者進(jìn)行了一系列實(shí)驗(yàn)來(lái)發(fā)現(xiàn)、驗(yàn)證和分析AF1子圖。這里主要涉及到Llama-3-8B和Llama-3.1-8B,以及在Pythia和GPT-J模型上的驗(yàn)證。

首先,通過(guò)三階段消融與窺視實(shí)驗(yàn),研究人員發(fā)現(xiàn)Llama-3-8B在A+B+C任務(wù)中只需前14層做任務(wù)通用計(jì)算(CAMA 層),然后通過(guò)2層信息傳輸讓最后的token獲取全局信息,剩余層僅進(jìn)行最后token的自計(jì)算。



這個(gè)幾乎保留全部性能的子圖被命名為AF1_llama

接下來(lái),研究人員又進(jìn)一步驗(yàn)證了AF1_llama在Llama-3-8B和Llama-3.1-8B上的表現(xiàn)。

實(shí)驗(yàn)表明,AF1_llama在八個(gè)任務(wù)中總體表現(xiàn)出高忠實(shí)度。



更進(jìn)一步,實(shí)驗(yàn)進(jìn)一步驗(yàn)證了第15和16層的信息傳輸在Llama-3-8B中的重要性。

研究表明,僅少數(shù)注意力頭對(duì)算術(shù)計(jì)算關(guān)鍵,即使移除近60個(gè)頭部,模型仍能保持約95%的準(zhǔn)確率,表明大部分注意力頭冗余,而關(guān)鍵頭集中在少數(shù)層。



此外,為了探究AF1_llama是否可以在Llama-3-8B上泛化到表示A+B和A?B運(yùn)算的其他算術(shù)形式,研究進(jìn)一步將口頭描述運(yùn)算以及將運(yùn)算嵌入到應(yīng)用題或Python代碼中。

實(shí)驗(yàn)表明,AF1_llama在不包含額外語(yǔ)義上下文的直接算術(shù)任務(wù)中仍保持了相當(dāng)高的準(zhǔn)確率。

然而,它在需要語(yǔ)義理解的任務(wù)上,如應(yīng)用題和Python代碼,完全失敗了,這表明它需要額外的組件來(lái)處理其他能力,比如理解自然語(yǔ)言或Python程序輸入。



最后,研究人員在Pythia和GPT-J中也發(fā)現(xiàn)了類(lèi)似AF1的子圖,但與Llama不同,這些模型的等待期更短(L_wait ≈ 9–11)、信息傳輸層更長(zhǎng),且性能邊界不如Llama清晰。

盡管忠實(shí)度普遍低于Llama,但對(duì)二元運(yùn)算任務(wù)的子圖仍能恢復(fù)超過(guò)一半的原始模型準(zhǔn)確率。



總體而言,這項(xiàng)工作為大語(yǔ)言模型中的算術(shù)推理和跨token計(jì)算的機(jī)制理解做出了貢獻(xiàn)。此外,它通過(guò)CAMA和ABP提供了方法論上的創(chuàng)新,可服務(wù)于算術(shù)任務(wù)之外的更廣泛應(yīng)用。

[1]https://x.com/rohanpaul_ai/status/1966788202238448101

[2]https://www.arxiv.org/pdf/2509.09650

免責(zé)聲明:本網(wǎng)信息來(lái)自于互聯(lián)網(wǎng),目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)。其內(nèi)容真實(shí)性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系我們,本站將會(huì)在24小時(shí)內(nèi)處理完畢。

全站最新
国产精品日韩欧美一区二区三区| 正在播放国产对白害羞| 99精品欧美一区二区三区小说| 国产精品久久久久久久久久99| 探花国产精品一区二区| 国产精品成人aaaaa网站| 免费不卡欧美自拍视频| 成人在线免费观看网址| 狠狠狠色丁香婷婷综合久久五月| 精品视频高清无人区区二区三区| 97视频在线观看成人| 国产精品视频免费看| 欧美一区二区三区爽爽爽| 亚洲wwwav| 欧美性猛片aaaaaaa做受| 亚洲欧美天堂在线| 久久丫精品久久丫| 亚洲国产综合91精品麻豆| 国产真实乱子伦| 亚洲一区在线看| 手机在线播放av| 精品国产免费人成在线观看| 日韩女优一区二区| 欧美超级免费视 在线| 国产精品999在线观看| 浅井舞香一区二区| 精品一区二区三区的国产在线播放| 蜜桃传媒视频麻豆第一区免费观看| 懂色av中文字幕一区二区三区| 影音先锋在线亚洲| 中文字幕视频一区| 亚洲精品乱码久久久久久蜜桃91 | 欧美色videos| 伦理中文字幕亚洲| 久久免费精品日本久久中文字幕| 激情av一区二区| 不卡视频免费在线观看| 国产精品永久在线| 丁香五精品蜜臀久久久久99网站| 宅男一区二区三区| 同产精品九九九| 欧美日韩大片在线观看| 91九色精品视频| 日本一区二区成人| 337p日本欧洲亚洲大胆张筱雨| 亚洲一区999| 国产男女裸体做爰爽爽| 伊人久久大香线蕉综合75| 一本大道av伊人久久综合| 69精品久久久| 美女一区视频| 欧美亚洲国产一区二区三区va | 欧美日韩国产综合视频在线| 午夜18视频在线观看| 色中色综合影院手机版在线观看| 老司机午夜免费精品视频| 污污网站免费看| 亚洲成人动漫精品| 国产日韩视频一区二区三区| 妖精视频在线观看| 少妇一级淫免费放| 日韩电影免费观看中文字幕| 亚洲色图狠狠干| 六月丁香婷婷激情| 亚洲天堂影视av| 美女精品一区| 亚洲欧美色婷婷| 免费在线观看成人| 久久国产免费视频| 国产a∨精品一区二区三区不卡| 国产女主播视频一区二区| 草草地址线路①屁屁影院成人| 69**夜色精品国产69乱| 精品亚洲成av人在线观看| 欧美丰满熟妇xxxxx| 午夜视频久久久久久| 日韩精品一区三区| 一女二男一黄一片| 国产探花在线视频| 国产老妇伦国产熟女老妇视频| 国产在线观看一区二区| 一区二区久久久久久| aaa级黄色片| 亚洲精品免费一区亚洲精品免费精品一区| 日本精品在线视频| 一本一本久久a久久精品综合麻豆| 亚洲天堂网在线观看视频| 日本中文字幕在线视频观看| 久久99久久99精品免观看粉嫩| 国产日韩欧美一区二区三区乱码| 男人av资源站| 红桃一区二区三区| 97超级碰碰碰久久久| 欧美性xxxxxxxxx| 五月婷婷六月丁香| 大又大又粗又硬又爽少妇毛片 | 特级西西444www大精品视频免费看| 天堂…中文在线最新版在线| 欧美精品www| 中文字幕在线播放不卡一区| 国产白丝一区二区三区| 国产欧美日韩综合精品二区| 亚洲美女精品久久| 国产成人麻豆精品午夜在线| 亚洲字幕av一区二区三区四区| 国产亚洲精久久久久久无码77777| 999精品网站| 欧美乱做爰xxxⅹ久久久| 国产午夜精品视频一区二区三区| 97超级碰碰碰久久久| 日韩成人av网址| 欧美三级日韩三级国产三级| 青草成人免费视频| 成人av电影免费| 日韩在线国产| 男人天堂a在线| 欧美黑人性视频| 97香蕉超级碰碰久久免费软件 | 日韩精品在线视频观看| 亚洲欧美综合另类在线卡通| 婷婷av一区二区三区| 精品在线观看一区| 在线观看的毛片| 欧洲精品国产| 成人福利视频在线观看| www.xxxx精品| 欧美精品在线一区二区| ㊣最新国产の精品bt伙计久久| 少妇无码一区二区三区| 免费看毛片网站| 国产精品天天干| 亚洲免费999| 亚洲一区二区三区乱码| 亚洲japanese制服美女| 日韩一卡二卡三卡四卡| 亚洲资源中文字幕| 日韩影院在线观看| 人妻精品久久久久中文字幕69| 亚洲免费视频一区| 天天综合色天天综合色hd| 国产免费观看久久黄| 欧美激情一区二区三区成人| 一区二区三视频| 日韩精品久久久| 99中文字幕| 亚洲午夜精品久久久久久性色| 欧美日韩中文国产| 五月激情丁香一区二区三区| 国产欧美一区二区三区鸳鸯浴| 激情综合色播五月| 日韩一级片免费| 在线观看毛片av| 一级片免费在线播放| 欧美丰满艳妇bbwbbw| 男人天堂av电影| 香蕉网在线播放| 男女一区二区三区| 国产在线不卡av| 久久精品综合视频| 午夜不卡久久精品无码免费| 午夜男人的天堂| 国产又粗又长又爽| 中文字幕日韩一级| 亚洲天堂网一区二区| 黑森林精品导航| 国产精品一区二区欧美| 国产精品欧美风情| 奇米影视首页 狠狠色丁香婷婷久久综合 | 国产一区视频观看| 91大神免费观看| aaaaa一级片| 精品无码m3u8在线观看| 色婷婷在线视频观看| 日本一级一片免费视频| 乱精品一区字幕二区| 国产老肥熟一区二区三区| 亚洲精品亚洲人成人网| 欧美日韩1234| 日韩精品一区国产麻豆| 88国产精品欧美一区二区三区| 韩国视频理论视频久久| 国产欧美综合精品一区二区| 北条麻妃在线一区| 熟女丰满老熟女熟妇| 乱熟女高潮一区二区在线| 成人a在线视频| 免费亚洲一区二区| 无码内射中文字幕岛国片| 免费成人深夜夜行网站| 欧美自拍偷拍第一页| 日本一区二区免费在线| 日韩一区二区高清| 日韩美女中文字幕| 欧美 日韩 国产精品| 成人乱码一区二区三区av| 精品国产www| 不卡一区二区三区四区| 在线亚洲一区观看| 秋霞成人午夜鲁丝一区二区三区| 一区二区91美女张开腿让人桶| 国产又大又黄又粗的视频| 欧美性受xxxx黑人| 超碰在线观看av| 国产精品理伦片| 91精品国产综合久久久久久久 | 精品人妻一区二区三区换脸明星| 亚洲精品影视在线观看| 欧美日韩精品免费看| 亚洲色图27p| 亚洲第一av色| 一女被多男玩喷潮视频| 蜜臀av性久久久久av蜜臀妖精| 亚洲欧美激情小说另类| 欧美激情第三页| 国产一区第一页| 午夜精品福利一区二区三区av| 91视频免费网站| 国产一级淫片a| 最新日韩在线视频| 欧美成人精品在线视频| 黄色免费观看视频网站| 免费精品视频最新在线| 欧美日韩成人在线观看| 日韩欧美猛交xxxxx无码| 亚洲欧美日韩一区二区三区四区| 午夜精品一区二区三区电影天堂| 无限资源日本好片| 久久夜色精品国产噜噜av | 精品国精品国产尤物美女| 成人久久精品视频| 亚洲精品乱码久久| 亚洲精品乱码久久久久久黑人| 国产精品v欧美精品v日韩| 一道本在线视频| 中文字幕视频在线免费欧美日韩综合在线看| 久在线观看视频| 免费观看黄一级视频| 亚洲福利在线播放| 中日韩av在线播放| 不卡视频在线观看| 色婷婷综合成人av| 日本 片 成人 在线| 99国产精品久久久久久久久久久| 欧美一区二区影视| 国产日本欧美一区二区| 国产精品永久入口久久久| 成年人免费大片| 国产精品亲子伦对白| 欧美激情视频免费看| 久久久久在线视频| 日韩久久精品成人| 夫妇露脸对白88av| 亚洲第一色中文字幕| 国产午夜福利一区二区| 国产精品久久久久久久久免费相片 | 免费视频91蜜桃| 亚洲欧洲中文日韩久久av乱码| 精品国产一区二区三区日日嗨| 精品不卡一区二区| 日韩av在线最新| 制服国产精品| 一区二区三区日| 亚洲的天堂在线中文字幕| 久久国产精品视频在线观看| 精品一区二区av| 精品一区二区三区国产| 精久久久久久久久久久| 国语精品免费视频| 成人爽a毛片一区二区| 成人免费xxxxx在线观看| 在线永久看片免费的视频| 国产一区二区三区色淫影院| 国产精品国产三级国产普通话蜜臀| 中文字幕一区二区三区人妻电影| 久久精品国亚洲| 中文字幕精品一区二| 美女精品视频一区| 乱h高h女3p含苞待放| 日韩一区和二区| 初高中福利视频网站| 午夜精品福利一区二区三区蜜桃| 三上悠亚在线一区| av一区二区不卡| 国产91视觉| 99在线精品视频免费观看软件| 久久久久99精品久久久久| 在线视频这里只有精品| 国产乱对白刺激视频不卡| 色综合电影网| 亚洲曰韩产成在线| 制服丝袜中文字幕第一页| 91久久精品一区二区二区| 国产精品白丝喷水在线观看| 青青青国产精品一区二区| 国产精品久久久久久亚洲伦| 人妻久久一区二区| 精品无码久久久久国产| 亚洲一级在线观看| 亚洲午夜无码久久久久| 欧美在线播放一区| 中文字幕不卡在线| 四虎永久免费网站| 欧美午夜影院在线视频| 国产精品九九九九九| 亚洲国产成人在线播放| 天天干天天操天天操| 亚洲人成网7777777国产| 国产女片a归国片aa| 日韩在线视频免费观看| 美女久久一区| 国产中文字幕在线免费观看| 亚洲视频在线播放| 青青草偷拍视频| 97国产真实伦对白精彩视频8| 成人深夜视频在线观看| www.日本久久| 91精品一区二区三区久久久久久 | 成人一区二区视频| 国产主播av在线| 欧美精品在欧美一区二区| 久久久精品在线| 亚洲日本va午夜在线影院| 在线观看免费视频一区| 搡女人真爽免费午夜网站| 久久精品在线视频| 成人中文字幕在线| 亚洲中文字幕无码不卡电影| 伊人一区二区三区久久精品| 免费av网站在线播放| 美国av一区二区三区| 欧美一区二区福利视频| 亚洲天堂一区在线观看| 成人精品视频在线| 久久九九久久九九| 第四色在线视频| 制服诱惑一区| 久久久在线观看| 久久久久国产一区二区三区四区| 午夜免费福利在线| 日韩在线免费av| 国产日韩欧美高清在线| 九九九久久久久| 亚洲欧美日韩天堂一区二区| 日韩1区2区日韩1区2区| 奇米777在线| 国模私拍一区二区三区| 国产精品久久久久影院色老大 | 亚洲欧美激情国产综合久久久| brazzers精品成人一区| 日韩欧美一区二区三区久久婷婷| 欧美精品国产精品日韩精品| 亚洲成a人片在线不卡一二三区| 97精品人妻一区二区三区香蕉| 欧美日韩性生活片| 色婷婷综合久久久久| 日本女优在线视频一区二区| 777久久久精品一区二区三区| 久久久国产91| 亚洲午夜久久久久久久久久久| 无码精品人妻一区二区| 中文字幕22页| 啊v视频在线一区二区三区| 久久66热re国产| 亚洲精品国产成人av在线| 91精品国产高清久久久久久| 国产精品三级久久久久三级| 国产亚洲成人av| 97超碰国产精品| 国产成人精品电影久久久| 亚洲a一区二区| 朝桐光av在线一区二区三区| 国内外成人免费激情视频| 成人av免费看| 欧美一区二区三区思思人| 先锋av资源站| 亚洲婷婷在线视频| 久久精品影视伊人网| 欧美 亚洲 视频| 欧美日韩免费一区二区| 成人av免费观看| 亚洲精品一区二区三区不| 日韩中文字幕一区二区| 91激情视频在线观看| 国产一区二区三区久久悠悠色av| 日韩亚洲欧美高清| 久久综合精品一区| 成人一级黄色大片| 99久久国产综合精品女不卡| 伊人久久久久久久久久久| 日韩中文在线字幕| 日本道在线观看| 椎名由奈av一区二区三区| 午夜精品久久久久久久99热| 看欧美ab黄色大片视频免费| 国产欧美日韩成人| 狠狠色香婷婷久久亚洲精品| 国产精品吴梦梦| 国产xxxx视频| 久久国产欧美日韩精品| 亚洲精品电影网| 成年人免费观看的视频| 国产福利拍拍拍| 亚洲欧洲综合另类在线 | 91av在线国产| 中文字幕av专区| 香蕉视频免费看| 欧美zozozo| 亚洲人一区二区| 日韩精品一区不卡| 天天色图综合网|