亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

五倍推理加速,激發自回歸潛能,蘋果新工作讓LLM預測未來

IP屬地 中國·北京 編輯:柳晴雪 機器之心Pro 時間:2025-07-24 16:27:12



機器之心報道

機器之心編輯部

近年來,語言模型的顯著進展主要得益于大規模文本數據的可獲得性以及自回歸訓練方法的有效性。

在這種自回歸的訓練框架中,每一個 token 都作為其前文上下文的預測目標。

這一方法無需顯式標注,使得自回歸模型在訓練階段具有明顯優勢,因而成為主流范式。

然而,在推理階段,自回歸生成本質上是順序執行的,計算開銷大,因為每一步解碼都需要完整地運行一次模型。相比之下,人類在表達時常常會先在句子層面組織思路,再逐詞輸出。

那么在大模型推理階段,能否讓大模型擺脫單個 token 順序預測的瓶頸,也和人類的邏輯一樣,從更大層面考慮輸出內容呢?

假如能夠打破自回歸模型的順序執行本質,就產生了如網友所說的「具有時間跳躍能力的 LLM」



受到啟發,蘋果的研究人員為此展開思考,借助類似策略,開發了一個框架,使預訓練的自回歸大型語言模型能夠執行多 token 預測,在保持生成質量的同時,為代碼和數學任務提供高達 5.35 倍的推理加速,以及為一般任務提供約 2.5 倍的推理加速

AI 工程師 Jackson Atkins 認為這是一項具有開創性的工作,「最令人興奮的是這一切都可以通過對現有模型進行 LoRA 微調實現」。



想象一下,將 AI 運行成本削減數倍,或是在輕量設備上流暢運行強大的實時助手,這對推理優化而言是一次顛覆性的變革。

如果你手中有一個運行速度提升 5 倍的大語言模型,第一件事會做什么?



論文標題:Your LLM Knows the Future: Uncovering Its Multi-Token Prediction Potential論文鏈接:https://www.alphaxiv.org/abs/2507.11851

首先探討一個基本問題:語言模型能否在單個推理步驟中生成多個 token?

令人鼓舞的是,答案是肯定的。

現有的推測解碼研究已經探索了這個方向以加快生成速度。推測解碼方法利用一個草稿模型生成多個 token,然后通過一個驗證器檢查它們與標準自回歸輸出的一致性。雖然這種方法提供了加速,但它仍然根本上依賴于自回歸生成。

在這項工作中,研究者們提出了一個更深層次的問題:我們能否訓練真正非自回歸的語言模型?

研究者們通過設計完全非自回歸的訓練算法來探討這一問題,例如基于擴散機制的語言模型。然而,此類方法通常需要構建全新的建模與訓練流程。

于是研究者們進一步提出一個問題:是否可以在盡可能少改動的前提下,適配現有的自回歸訓練與推理框架?目標是實現在保留自回歸模型核心優勢的同時,實現高效的多 token 生成。

為進一步論證這一點,研究者們首先觀察到,自回歸模型雖然并未明確針對未來 token 進行訓練,但實際上已經在一定程度上編碼了關于未來 token 的信息。

例如,給定提示詞 “what is two plus two?”,一個預訓練模型在標準自回歸解碼過程中通常會生成 “two plus two equals four”。為了檢驗模型是否具備對未來 token 的感知能力,研究者們在提示后添加占位 token(圖中以 ? 表示),并分析輸出的 logits,如圖 1 (左)所示。

令人驚訝的是,未來 token 的正確序列出現在前 200 個 logits 中,說明模型在某種程度上已隱含地掌握了即將生成的 token 信息



圖 1:自回歸模型能夠隱式預判未來的 token。

基于上述觀察,研究者們進一步探究能否引導模型發揮其潛在能力,從而更好地組織對未來 token 的預測。

為此,研究者在提示詞末尾引入若干mask token,并對模型進行訓練,使其能夠直接預測這些 token。如圖 1 (中)所示,經過微調后的模型能夠將正確的 token 提升至前 10 個 logits 中。

最后,為生成連貫的多 token 輸出,研究者們引入了一個輕量級的采樣模塊:一個兩層感知機(two-layer perceptron),該模塊在預測每個 token 時,結合先前已采樣出的 token 作為條件,具體結構如圖 1 (右)所示。

與之前的一些方法不同,本文訓練模型填充 mask token,以預測未來 token。該模型在推理這些 token 時,充分利用了自身的全部深度與表示能力,并結合整個序列的上下文信息,從而在效果上顯著優于現有的多 token 預測方法。

此外,得益于一種簡單而有效的技術 ——門控 LoRA 適配(gated LoRA adaptation),本方法在生成質量上無任何下降

在較為輕量的監督微調下,研究者們相較于傳統回溯式生成模型實現了加速效果。如圖 2 所示,在 Tulu3-8B 模型基礎上微調以預測 8 個額外 token,即可獲得顯著性能提升。



圖 2:在通過監督微調訓練門控 LoRA 和采樣頭后獲得的加速效果。

方法

為在盡量減少重新訓練的前提下實現多 token 生成,引入了一類特殊的 token,稱為 mask。設原始序列為 X = [x1, …, xn],基本思路是在該序列末尾附加 k 個唯一的 mask token,從而構造出擴展序列 Xm = [x1, …, xn, m1, …, mk]。其中,mask token [m1, …, mk] 的表示向量被初始化為隨機向量,并添加至模型的嵌入表中。

在本文中,將模型對標準下一個 token 的預測稱為 NTP(Next Token Prediction),而對 mask token 的預測稱為 MTP(Mask Token Prediction)。

本文所提出的 MTP 模型的整體架構如圖 3 所示,其中展示了在微調時使用 k=2 個 mask 的模型在推理階段的工作流程。在圖中 box-1(左上角),擴展后的序列 Xm 被輸入至解碼器,模型生成的潛在表示中,[z1, …, zn] 對應于 NTP token 的表示,而 [zn+1, …, zn+k] 則對應于 MTP token 的表示。



圖 3:MTP 模型的組成部分。框 1(左上)顯示了帶有門控 LoRA 參數的自回歸模型。框 2(左下)說明了采樣頭。框 3(右)展示了門控 LoRA 模塊的框圖。

圖中 框 2(左下)展示了采樣器頭(sampler head)的結構。第一個(NTP)token 通過標準的反嵌入層(unembedding layer)以自回歸方式生成,即由 z_n 預測出 y_n+1。而剩余的(MTP)token 則由采樣器模塊依次生成。在每一步中,采樣器根據 z_n+k+1 與前一個已生成的 token y_n+k 來預測 y_n+1+k,確保每個生成的 token 同時融合模型的潛在表示與先前已采樣的 token 信息。

為了在微調時保留預訓練模型的行為,研究者們在解碼器層中引入了門控 LoRA 模塊(gated LoRA)。微調過程中,僅更新 LoRA 參數與采樣器頭參數,原始解碼器權重保持凍結狀態。門控 LoRA 模塊通過對 NTP 與 MTP token 分別采取不同的計算路徑,確保微調過程不會影響 NTP token 的生成行為,如圖中 框 3(右側)所示。該差異通過引入二進制 mask 實現,二進制 mask 被作為額外輸入傳入解碼器層。

詳細的模型訓練過程請參閱原論文。

實驗

研究者們在 Tulu3-8B SFT 模型上開展了實驗。該模型屬于 LLaMA-3 系列,并基于 Tulu3 數據集進行了有監督微調。

生成質量評估

研究者們首先在微調過程中跟蹤了模型的準確率變化。由于所用模型為 SFT 模型,其對額外訓練非常敏感。圖 6 (a) 展示了模型在 ARC-Challenge 基準上的 zero-shot 準確率,該評估通過 Harness 庫完成。

如圖 6 (a) 中的虛線所示,gated LoRA 能夠保持準確率穩定,原因在于其保證了 NTP token 的輸出不會受到微調影響。

如圖 6 (b) 中所示,在標準 LoRA 與 gated LoRA 兩種訓練方式都實現了有效的收斂。

接下來,研究者們在圖 6 (c) 中分析了 NTP token 上的交叉熵損失,該指標與生成質量直接相關。如圖所示,使用標準 LoRA 訓練的模型,其 NTP 損失呈上升趨勢,表明生成質量逐漸下降。相比之下,采用 gated LoRA 的模型在整個訓練過程中保持了幾乎恒定的 NTP 損失,這是因為在 gated LoRA 機制下,梯度不會在 NTP token 上傳播,從而有效避免了對原始生成能力的干擾。



圖 6:使用標準 LoRA 和門控 LoRA 適配器訓練的模型收斂性分析。

加速能力分析

為了評估所提方法在生成速度上的提升,研究者們采用了自推測解碼算法(self-speculative decoding)。

實驗最多運行 100 個生成步驟,若模型在第 100 步之前生成了句子結束符(end-of-sentence token),則提前終止生成過程。設總生成步驟數為 T,總生成 token 數為 G,則計算接受率(acceptance rate)為 G/T。該指標反映了模型平均每一步生成多少個被接受的 token,進而衡量所提方法帶來的加速效果。

接受率的理論最小值為 1,因為每一步至少會生成一個 token(即標準的下一個 token 預測)。最大理論值為 k+1=9,其中 k=8 是訓練時使用的 mask token 數量。

表 1 報告了模型在五個不同任務領域下的接受率,包括:知識問答、數學、編程、對話和安全。

如表所示,所提出的多 token 生成算法在不同任務上實現了約 1.5 到 5.2 倍不等的加速,具體取決于任務類型及插入的 mask 數量。值得注意的是,在編程和數學任務中,加速效果更為顯著,可能是因為這些領域中未來 token 的可預測性較高。



表 1:Tulu-3 在不同領域中通過多標記預測獲得的加速。

消融實驗

表 1 中的結果對應于本方法的最優配置,包含以下三個關鍵組件:

(1)使用采樣器 MLP 頭(sampler MLP head);

(2)訓練過程中引入 LCM 損失(LCM loss);

(3)生成階段采用二次解碼算法(quadratic decoding algorithm)。

研究者們對各個組件的貢獻進行了消融實驗。



圖 7: MTP 模型的簡單配置和最先進配置所達到的平均加速效果。基礎版本使用線性解碼,不包含 LCM 損失或采樣頭,而高級版本則包含 LCM 損失、采樣頭和二次解碼。

研究者們訓練了多個不同 LoRA 秩的模型,以進一步探索其影響。圖 8 總結了相關結果:左側與中間子圖分別展示了在未使用與使用采樣器頭的條件下的接受率;右側子圖則展示了采樣器頭與 LoRA 參數所帶來的顯存開銷。



圖 8:LoRA 秩的影響:無采樣頭加速(左),帶采樣頭加速(中),以及 LoRA 和采樣頭的內存開銷(右)。

總結

研究者們評估了自回歸模型在語言模型有監督微調階段對多 token 預測任務的適應能力。未來值得探索的一個方向,是在預訓練階段或下游任務自適應階段引入該方法,以進一步檢驗其適用性與效果。另一個具有前景的研究方向是將基于擴散的生成方法應用于多 token 預測任務。研究者們認為,多 token 預測位于完全自回歸生成與完全擴散生成之間,能夠在兩者之間取得優勢的平衡,兼具效率與質量的潛力。

更多信息,請參閱原論文。

免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

亚洲成av人片在线观看香蕉| 欧美性大战久久| 欧美激情一二三区| 91网站黄www| 国产精品污污网站在线观看| 亚洲永久免费视频| 欧美在线一区二区| 精品欧美一区二区久久 | 黄色aaa毛片| 亚洲欧美黄色片| 国产精品一区二区无线| 国产女主播视频一区二区| 亚洲乱码国产乱码精品精可以看 | 久久一区二区三区av| 欧美一区二区三区四区夜夜大片 | 欧美成年人视频| 国产91免费看片| 国产精品三区www17con| 福利视频免费在线观看| www.四虎精品| 日本a在线观看| 亚洲国产精品久久人人爱潘金莲| 国产高清无密码一区二区三区| 中文字幕欧美区| 欧美在线免费播放| 色偷偷偷综合中文字幕;dd| 97在线观看免费高清| 97超碰在线播放| 国产一区二区四区| 美女100%无挡| 一卡二卡三卡在线| 国产jizzjizz一区二区| 姬川优奈aav一区二区| 亚洲国产小视频在线观看| 午夜精品久久17c| 日本一区二区精品视频| 亚欧激情乱码久久久久久久久| 黄色av片三级三级三级免费看| 亚洲资源在线播放| 不卡区在线中文字幕| 欧美日韩免费一区| 欧美成人精品在线观看| 你懂的视频在线一区二区| 国产又爽又黄ai换脸| 全黄性性激高免费视频| 久久久久久久影院| 国产亚洲精品激情久久| 日韩欧美三级在线| 国产欧美日韩视频一区二区| 国产精品久久久久久69| 欧美色精品在线视频| 亚洲欧美视频在线| 中文字幕国产日韩| 久久综合九色欧美综合狠狠| 亚洲欧洲99久久| 亚洲电影一级黄| 欧美亚洲日本国产| 国产成人午夜视频网址| 国产精品一区久久久| 久久69精品久久久久久国产越南| 欧美在线视频一区二区| 国产精品 欧美在线| 精品视频全国免费看| 欧美在线播放视频| 日韩精品综合在线| 特级特黄刘亦菲aaa级| 一级黄色大片免费| 校园春色 亚洲| 美女视频黄免费的久久| 亚洲尤物视频在线| 国产精品视频久久| 日本在线视频www| 激情伊人五月天| 我的公把我弄高潮了视频| 国产精品成人无码免费| 性爱在线免费视频| 精品少妇theporn| 欧美一区二区大片| 亚洲人成网站999久久久综合| 成人欧美一区二区三区黑人孕妇 | 欧美天堂在线观看| 国产在线一区二区三区播放| 国产真实乱在线更新| 91麻豆精品国产无毒不卡在线观看| 亚洲精品9999| 蜜桃av.com| 久久久久久久九九九九| 欧美成人免费在线| 香蕉视频免费版| 天天做天天爱天天高潮| 青青操在线播放| 日韩精品一区二区三区视频在线观看| 国产高清视频一区三区| 97成人在线观看视频| 国产天堂视频在线观看| 神马影院午夜我不卡| 中文字幕在线欧美| 亚洲成人福利片| 91网址在线观看精品| 午夜精品久久久久久久| 乌克兰美女av| 亚洲高清一区二区三区| 国产精品久久久久国产a级| 91成人在线视频观看| 一级性生活免费视频| gogo大胆日本视频一区| 日本国产高清不卡| 91最新在线免费观看| 青青久久aⅴ北条麻妃| 国产精品久久久久久久久免费看| 成人午夜在线影院| 99国产精品免费视频| 成人午夜伦理影院| 亚洲AV无码一区二区三区少妇| 亚洲精品一区二区三区影院 | 九九热最新地址| 欧美日韩一区二区在线观看视频| 97精品国产97久久久久久粉红| 91视频青青草| 久久久不卡网国产精品一区| 久久久久久网站| 久久久香蕉视频| 成人毛片18女人毛片| 黄色一区二区视频| 国产在线国偷精品免费看| 国产精品美女久久久久久久网站| 欧美亚洲国产成人精品| 北岛玲一区二区| 国产主播一区二区| 国产精品日韩一区二区免费视频| 久久精品动漫| 日韩在线导航| 欧美日韩一区二区三区四区 | 国产一区二区0| 欧美激情视频网站| 国产chinese中国hdxxxx| 玉米视频成人免费看| 真人抽搐一进一出视频| 黄色污污网站在线观看| 久久先锋资源| 亚洲成av人片一区二区梦乃| 日韩亚洲在线观看| 亚洲bbw性色大片| av一区二区三区四区| 欧美激情一区二区三区在线视频 | 欧美日韩亚洲国产成人| 欧美精品日韩一本| 亚洲黄色小说网| 青草全福视在线| 欧美日韩久久久久久| 蜜桃av乱码一区二区三区| 亚洲欧美另类小说| 亚洲精品一区二| 国产裸体永久免费无遮挡| 亚洲一区久久久| 圆产精品久久久久久久久久久| 美女久久久精品| 日韩精品中文字幕一区| 日韩高清国产一区在线观看| 中文字幕在线有码| 欧美精品做受xxx性少妇| 国产区在线观看视频| 精品免费视频.| 欧美特黄一区二区三区| 欧美激情精品久久久久久黑人| 国产精品免费久久| 少妇高潮久久久| 国产综合精品在线| 日本高清一区| 一区二区三区中文字幕| 情侣黄网站免费看| 欧美日韩美女在线观看| 亚洲の无码国产の无码步美| 欧美日韩国产一区| 国产精成人品免费观看| 毛片一区二区三区| 久久视频在线视频| av在线天堂网| 国产精品色在线| 亚洲精品久久久久久一区二区| 色综合久久久久久久久| 亚洲欧美va天堂人熟伦| 日韩精品视频三区| 人妻精品一区二区三区| 日本人dh亚洲人ⅹxx| 九九九九九九精品| 欧美激情在线视频二区| 亚洲欧美综合在线精品| 亚洲一区二区在线免费| 亚洲美女又黄又爽在线观看| 精品一区二区三区蜜桃在线| 国产精品中文字幕在线| 国产视频在线观看一区二区三区| 国产白丝一区二区三区| 日韩亚洲欧美中文三级| 欧美 日韩 亚洲 一区| 麻豆视频一区二区| 91中文字幕在线观看| 一级全黄裸体免费视频| 欧日韩免费视频| 欧美精品免费视频| a级片在线观看免费| 国产乱码精品一区二区三区日韩精品| 亚洲另类在线视频| 亚洲第一天堂在线观看| 女女互磨互喷水高潮les呻吟| 亚洲欧美日产图| 精品精品欲导航| 一级日韩一级欧美| 色综合电影网| 亚洲成avwww人| 五月婷婷视频在线| 男人天堂成人网| 亚洲欧洲视频在线观看| 日韩女优在线播放| 久久精品国产99国产| 国产v亚洲v天堂无码| 国产jizzjizz一区二区| 久久无码精品丰满人妻| 免费观看亚洲视频| 国产午夜精品视频免费不卡69堂| 国内成+人亚洲+欧美+综合在线| 亚洲一级理论片| 538精品视频| 亚洲波多野结衣| 99热在线观看精品| 成人片黄网站色大片免费毛片| 国产v亚洲v天堂无码久久久| 69av在线视频| 色综合天天综合网天天狠天天| 日韩大片免费在线观看| 欧美啪啪免费视频| 久久久亚洲精选| 91久久精品一区二区三| 国产极品国产极品| 久久精品国产精品亚洲| 国产精品亚洲lv粉色| 亚洲自拍欧美色图| 在线观看免费高清视频| 自拍偷拍一区二区三区四区| 成人免费观看a| 日韩精品免费在线观看| 成人的网站免费观看| 亚洲中文一区二区| 国产伦理片在线观看| 中文字幕在线播放视频| 亚洲av无码一区二区三区观看| 成熟了的熟妇毛茸茸| 日本xxxxx18| 久久精品成人动漫| 不卡高清视频专区| 午夜精品久久久久久久96蜜桃| 涩视频在线观看| 日本福利视频导航| 中文天堂在线一区| 国内免费精品视频| 黄色一级片黄色| 香蕉久久夜色| 欧美剧在线观看| 日韩欧美一区二区视频| 成人av影院在线| 好看的av在线| 97香蕉超级碰碰久久免费软件| 欧美亚洲一区二区三区四区| 欧美激情在线看| 亚洲视频免费看| 欧美小视频在线观看| 色诱亚洲精品久久久久久| 一区二区三区精品在线观看| 狠狠色2019综合网| 日本特级黄色片| 337p粉嫩大胆噜噜噜鲁| 91久久极品少妇xxxxⅹ软件| 日韩在线不卡视频| 日韩精品免费在线播放| 熟妇高潮一区二区高潮| 国产免费美女视频| 男的操女的网站| 国产成人精品一区二区无码呦| 国产小视频在线免费观看| 女同性恋一区二区三区| 精品国产免费久久久久久婷婷| 伊人情人网综合| 欧美日本高清视频在线观看| 色中色一区二区| 51精品久久久久久久蜜臀| 日韩精品影音先锋| 国产精品视频内| 成人观看免费完整观看| 国产一区二区三区无遮挡| 国产日韩av网站| 中文字幕第九页| 国产性生活网站| 国产精品无码在线| 熟妇人妻久久中文字幕| 爱情岛论坛亚洲自拍| 久久久久久久久久影视| 国产女人18毛片水真多18| 亚洲xxxx3d动漫| 欧美在线一区视频| 国产欧美日韩综合精品二区| 成人黄色激情网| 性刺激综合网| 在线免费观看麻豆| а中文在线天堂| 日本精品久久久久久| 国产91精品入口| 亚洲成人手机在线| 99久久精品国产一区| 久久国产三级精品| 99久久久精品免费观看国产蜜| 亚洲视频香蕉人妖| 亚洲国产一区二区三区在线观看 | 亚洲美女性视频| 色天天综合久久久久综合片| 国产精品理论在线观看| 亚洲综合丁香婷婷六月香| 亚洲免费在线观看视频| 色88888久久久久久影院按摩| 欧美日韩精品一区视频| xnxx国产精品| 亚洲欧美日韩国产综合| 国产精品久久久久一区二区三区共| 亚洲精品视频久久| 91精品国产综合久久男男 | 蜜桃av噜噜一区二区三| av在线亚洲男人的天堂| 精品一区二区久久久久久久网站| 国产精品一区二区三区不卡| 91sao在线观看国产| 综合网中文字幕| 97精品在线观看| 成人国产一区二区| 国产精品久久久久久久久久三级| 97免费在线视频| 91久久精品国产91性色| 亚洲日本理论电影| 男人的天堂免费| 97人妻精品一区二区三区软件| 国产一本一道久久香蕉| 国产网站一区二区三区| 4438x成人网最大色成网站| 久久五月情影视| 欧美成人在线免费视频| 成人一区二区电影| 国产精品中文字幕久久久| 久久99影院| 椎名由奈jux491在线播放| 性猛交ⅹ×××乱大交| 超碰网在线观看| 亚洲毛茸茸少妇高潮呻吟| 亚洲午夜久久久久中文字幕久| 日韩在线一二三区| 青娱乐91视频| 手机免费看av片| 国产 欧美 日本| 国产欧美婷婷中文| 日韩最新在线视频| 欧美日韩久久一区| 有坂深雪av一区二区精品| 极品销魂美女一区二区三区| 波多野结衣视频免费观看| 国产精品密蕾丝袜| 国产精品自拍视频在线| 青青青在线观看视频| 91国产在线免费观看| 欧美日韩国产999| 国产一区二区三区视频免费| 欧美性xxxxxx| 国产欧美日韩不卡免费| 狠狠色丁香久久婷婷综合_中 | 黄色录像免费观看| 国产精品嫩草影院8vv8| 日韩a级黄色片| 韩国成人av| 欧美精品18videos性欧| 欧美精品乱码久久久久久按摩| 不卡欧美aaaaa| 日本精品久久久久久| 日本天堂网在线| 成人观看免费视频| 爱爱免费小视频| 欧美性久久久久| 欧美黄色免费网址| 日韩aⅴ视频一区二区三区| 99在线视频播放| 国产日韩欧美日韩| 自拍偷拍免费精品| 亚洲精品国产免费| 欧美裸体bbwbbwbbw| 欧美亚州韩日在线看免费版国语版| 亚洲素人一区二区| 国产日产亚洲精品系列| 国产亚洲综合性久久久影院| 成人免费视频app| 懂色av噜噜一区二区三区av| 精品无码三级在线观看视频| 国产精品系列视频| 一级做a爱片久久毛片| 怡红院男人天堂| 亚洲一卡二卡在线观看| 天天干,天天干| 欧美精品韩国精品| 欧洲美女女同性互添| 免费成人深夜天涯网站| 少妇一级黄色片| 免费成人深夜夜行网站| 久艹视频在线观看| 中文字幕日韩一级| 中文字幕一区二区人妻视频|