亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

無Tokenizer時代真要來了?Mamba作者再發顛覆性論文,挑戰Transformer

IP屬地 中國·北京 編輯:江紫萱 學術頭條 時間:2025-07-12 22:06:47


內容來自:機器之心

Tokenization,一直是實現真正端到端語言模型的最后一個障礙。

我們終于擺脫 tokenization 了嗎?

答案是:可能性無限大。

最近,Mamba 作者之一 Albert Gu 又發新研究,他參與的一篇論文《 Dynamic Chunking for End-to-End Hierarchical Sequence Modeling 》提出了一個分層網絡 H-Net,其用模型內部的動態分塊過程取代 tokenization,從而自動發現和操作有意義的數據單元。


「這一研究預示著 Tokenizers 正在退場,智能字節分塊(Smart Byte Chunks)開始登場。或許無需 Tokenizer 訓練的時代真的要來了 —— 可能性無限大。」X 知名博主 Rohan Paul 表示道。


現階段,Tokenization 仍然是語言模型和其他順序數據不可或缺的組成部分,因為它能夠壓縮和縮短序列。然而 Tokenization 存在許多缺點,如可解釋性差,在處理復雜語言(如中文、代碼、DNA 序列)時性能下降等。

迄今為止,尚未有任何端到端的無 tokenizer 模型在計算預算相匹配的情況下超越基于 tokenizer 的語言模型的表現。最近,已經有研究開始致力于在自回歸序列模型中突破 Tokenization 限制。

在此背景下,來自 CMU、 Cartesia AI 等機構的研究者提出了一系列新技術,通過動態分塊機制實現內容與上下文自適應的分割策略,該機制可與模型其他部分聯合學習。將這一機制融入顯式分層網絡(H-Net)后,原本隱含分層的「tokenization–LM–detokenization」流程可被完全端到端的單一模型取代。

在計算資源和數據量對等的條件下,僅采用單層字節級分層的 H-Net 模型,其表現已優于基于 BPE token 的強 Transformer 語言模型。通過多級分層迭代建模不同抽象層級,模型性能得到進一步提升 —— 這不僅展現出更優的數據規模效應,更能媲美兩倍規模的基于 token 的 Transformer 模型

在英語預訓練中,H-Net 展現出顯著增強的字符級魯棒性,并能定性學習有意義的、數據依賴的分塊策略,全程無需啟發式規則或顯式監督。

最后,在 tokenization 啟發式方法效果較弱的語言和模態(如中文、代碼或 DNA 序列)中,H-Net 相比 tokenization 流程的優勢進一步擴大(數據效率較基線提升近 4 倍),這證明了真正端到端模型從未經處理數據中實現更優學習和擴展的潛力。


論文地址:https://arxiv.org/pdf/2507.07955v1

沒有 Tokenization 的端到端序列建模

本文提出了一種端到端的分層網絡(H-Net),通過遞歸、數據依賴的動態分塊(DC,dynamic chunking)過程壓縮原始數據(見圖 1)。H-Net 在保持與 token 化流程相同效率的同時,通過用從數據中學習的內容感知和上下文依賴的分割替代手工啟發式方法,顯著提高了建模能力。


分層處理

H-Net 采用了分層架構,其工作流程分為三步:

精細處理:先用小型編碼器網絡處理原始數據(如逐個字節 / 字符);

壓縮抽象:將數據壓縮下采樣后,交給主網絡(可理解為大腦核心)處理;

還原輸出:最后上采樣并通過解碼器還原到原始精度。

這種設計形成了天然的認知分層 —— 外層捕捉細粒度的模式,內層處理抽象概念。

關鍵是,主網絡包含了大部分參數,并且可以適配任何標準架構,例如 Transformer 或狀態空間模型(SSM)。

動態分塊

H-Net 的核心是動態分塊(DC)機制,它位于主網絡與編碼器 / 解碼器網絡之間,用于學習如何分割數據,同時使用標準的可微優化方法。DC 由兩種互補的新技術組成:

(i) 路由模塊,通過相似度評分預測相鄰元素之間的邊界;

(ii) 平滑模塊,使用路由器的輸出插值表示,通過減弱不確定邊界的影響,顯著提高學習能力。

通過將這些技術與一個新的輔助損失函數結合,并利用現代基于梯度的離散選擇學習技術,DC 使得 H-Net 能夠以完全端到端的方式學習如何壓縮數據。

信號傳播

本文還引入了幾種架構和訓練技術,以提高端到端優化過程中的穩定性和可擴展性。這些技術包括:(i) 精心布置的投影層和歸一化層,以平衡交互子網絡之間的信號傳播;(ii) 根據每層的維度和有效批次大小調整其優化參數。

總的來說,H-Net 學習了與主干網絡聯合優化的分割策略,基于上下文信息動態地將輸入向量壓縮成有意義的數據塊。

H-Net 代表了第一個真正的端到端、無 tokenizer 的語言模型:通過一個動態分塊階段,字節級的 H-Net 在超過 10 億參數的規模下,達到了與強大的 BPE token 化 Transformer 相當的困惑度和下游性能。

從經驗上看,動態分塊模塊自然地將數據壓縮到與 BPE tokenizer 相似的分辨率(每塊 4.5-5 字節),并且在沒有任何外部監督或啟發式方法的情況下,定性地學習到有意義的邊界。

實驗及結果

實驗中,本文采用的主要語言模型架構如下所示,如 MambaByte 是使用純 Mamba-2 層的各向同性模型。


訓練曲線。圖 3 顯示了 Large 和 XL 規模模型在整個訓練過程中的驗證 BPB 指標。


在較大規模上,本文注意到:

所有各向同性模型在性能上都遠遜色于分層模型。在這些模型中,MambaByte 明顯優于 LlamaByte。

SpaceByte 明顯遜色于 SpaceByte++,這一結果驗證了本文在外部網絡中使用 Mamba 的有效性。SpaceByte++ 又比 H-Net(space)差,表明本文提出的改進信號傳播技術的有效性。

H-Net(space)是一個非常強大的模型,達到了與 BPE Transformer 相當的性能,驗證了數據依賴的分塊策略與精心設計的分層架構的效果。

表 2 展示了不同模型在多個下游基準測試上的零樣本準確率。

SpaceByte++、H-Net(space)和 H-Net(1-stage)在大規模上與 BPE Transformer 的性能相似,在 XL 規模上稍微超越了 BPE Transformer。


表 3 評估了模型在 HellaSwag 上的魯棒性。與所有基準模型相比,H-Net(2-stage)顯著提高的魯棒性。


圖 4 提供了 H-Net(1-stage)和 H-Net(2-stage)動態繪制的邊界的可視化圖。這些可視化提供了關于模型如何決定邊界的幾個重要見解。


即使使用 Llama3 tokenizer,本文發現 H-Net(2-stage)在中文和代碼處理上,比 BPE Transformer 和 H-Net(space)具有更好的擴展性(圖 5),并且在衰退階段后實現了更低的壓縮率(表 4)。

之前的研究已經證明,SSM 在 DNA 序列建模上比 Transformer 表現更好。實驗(表 5)也驗證了這一點:即使換成 Mamba-2 作為主網絡,SSM 的優勢仍然存在。



實際上,通過直接比較訓練穩定階段的困惑度曲線(圖 6),本文發現 H-Net 模型在數據量僅為 3.6 倍的情況下,能夠達到與各向同性模型相似的性能,這一發現適用于兩種主網絡架構的選擇。


最后,Albert 還撰寫了精彩的博客文章,介紹關于 H-Net 的幕后故事和精彩見解。感興趣的讀者可以前去閱讀。

博客地址:https://goombalab.github.io/blog/2025/hnet-past/

了解更多內容,請參考原論文。

免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

国产成人a亚洲精品| 中文字幕日韩欧美精品在线观看| 国产日韩欧美精品| 免费一级黄色大片| 亚洲色图综合久久| 午夜激情福利电影| 欧美性大战久久久久久久蜜臀| 日韩中文字幕免费在线| 久久久亚洲国产美女国产盗摄| 亚洲资源在线看| 日韩欧美一级大片| 国语自产在线不卡| 亚洲精品字幕在线观看| 99国产精品久久久久老师| 久久精品国产99国产| 国产精品久久久久久久久久久久久久久久久久 | 一区二区三区成人| 国产资源在线视频| 欧美视频在线观看 亚洲欧| 日日噜噜夜夜狠狠久久丁香五月 | 丰满人妻一区二区| 免费在线成人av| 国产精品国产三级国产专播品爱网| 国产男女免费视频| 欧美亚日韩国产aⅴ精品中极品| 麻豆国产精品一区| 精品sm捆绑视频| 波多野结衣有码| www.欧美三级电影.com| 久久国产免费| 一级特黄录像免费播放全99| 中文字幕乱码日本亚洲一区二区 | 成人午夜免费剧场| 欧美日韩国产精品成人| 国产精品69久久久久孕妇欧美| 欧美精品在线视频| 日本a级c片免费看三区| 天堂精品一区二区三区| 亚洲国产日韩在线一区模特| 国产黑丝一区二区| 久久国产精品久久久久久久久久| 五月天婷婷久久| 蜜桃999成人看片在线观看| 亚洲女同一区二区| 九九热精品免费视频| 热久久99这里有精品| av网站一区二区三区| 国产黄色特级片| 91超碰caoporn97人人| www.日本不卡| 精品久久免费视频| 美女一区视频| 日韩一区二区麻豆国产| 中文字幕日韩经典| 在线观看国产一级片| 97在线看福利| 性欧美疯狂xxxxbbbb| 国产日韩免费视频| 精品这里只有精品| 视频在线观看一区二区| 欧性猛交ⅹxxx乱大交| 中文在线字幕观看| 99re在线观看| 欧美不卡一区二区三区| 国产精品资源在线看| 无码精品一区二区三区在线播放| 成人欧美在线视频| 亚洲国产日韩欧美在线动漫| 国产精品久久久一本精品| 黄色小视频在线免费看| 欧美成人免费在线观看视频| 欧美日韩国产成人在线| 欧美色成人综合| 成人aa视频在线观看| 亚洲精品国产精品乱码视色| 亚洲黄色av片| 蜜桃网站成人| 久久亚洲欧美日韩精品专区 | 欧美亚洲精品一区二区| 国产欧美日韩在线播放| 一区二区三区高清国产| 亚洲天天做日日做天天谢日日欢 | 成人一区二区在线观看| 不卡的日韩av| 蜜桃传媒一区二区亚洲| 欧美大黑帍在线播放| 成人欧美一区二区三区在线观看| 亚洲精品久久久久久久久久久| 尤物在线观看一区| 99久久久久久| 91免费精品国自产拍在线不卡| 精品人妻无码一区二区色欲产成人| 日本少妇高潮喷水xxxxxxx| 一本色道久久综合亚洲精品婷婷| 国产91精品一区二区绿帽| 亚洲欧洲在线视频| 色悠久久久久综合欧美99| 99精品1区2区| 天堂va蜜桃一区二区三区漫画版| 国产日韩免费视频| 波多野结衣大片| 国产乱码77777777| xxxx日本少妇| 一区二区成人网| 波多野结衣天堂| 波多野结衣与黑人| 激情五月婷婷基地| 欧美日韩激情视频在线观看| 高清av免费一区中文字幕| 欧美又大粗又爽又黄大片视频| 久久免费视频网| 性欧美xxxx视频在线观看| 国产午夜精品视频| 伊人精品在线观看| 色诱女教师一区二区三区| 久久精品影视伊人网| 日韩亚洲一区二区| 久久久人成影片一区二区三区| 亚洲天天在线日亚洲洲精| 亚洲精品狠狠操| 97在线视频一区| 欧美激情a在线| 日本中文字幕久久看| 伊人青青综合网站| 亚洲欧美激情精品一区二区| 久久久久久久久久久av| 5g国产欧美日韩视频| 成人91免费视频| 国产精品入口日韩视频大尺度| 亚洲最大成人免费视频| 日韩一级免费看| 亚洲一区二区三区蜜桃| 成人免费精品动漫网站| 超碰在线免费97| 国产一区二区91| 久久久精品国产免大香伊| 国产精品久久久久久久久果冻传媒 | 91精品国产高清自在线| 欧洲美女7788成人免费视频| 亚洲精品在线观看免费| 日韩欧美视频网站| 中文字幕avav| 自拍偷拍色综合| 岛国av在线一区| 色一情一伦一子一伦一区| 日韩欧美一卡二卡| 国产在线视频一区| 国产探花在线观看视频| 精品免费囯产一区二区三区| 黄色av免费观看| 国产原创一区二区| 在线观看日韩av先锋影音电影院| 日韩在线免费视频观看| 精品国产一区二区三区日日嗨 | 日本三级午夜理伦三级三| 成人午夜福利视频| 亚洲国产一区二区在线播放| 亚洲激情成人网| 男同互操gay射视频在线看| 黄色一级视频在线观看| 国产一区二区日韩精品| 亚洲地区一二三色| 久久精品国亚洲| 国产亚洲色婷婷久久| 日韩免费av片| 亚洲麻豆国产自偷在线| 91免费观看| 国产伦理吴梦梦伦理| 精品综合久久久久久8888| 99re成人精品视频| 日韩精品中文字| 日本精品国语自产拍在线观看| 无码人妻精品一区二区中文| 国产亚洲成av人片在线观看桃| 亚洲v国产v欧美v久久久久久| 亚洲图片你懂的| 黄色一级在线视频| 国产亚洲欧美日韩在线一区| 992tv在线成人免费观看| 中文字幕一区二区三区乱码| 天天爽夜夜爽夜夜爽精品| 国产精品精品久久久| 国产一区二区三区四区五区美女| 91精品国产色综合久久不卡98| 日本一二三区在线观看| 中文字幕欧美国产| 国产免费一区二区三区在线观看| 亚洲精品偷拍视频| 小泽玛利亚一区二区三区视频| 91精品国产色综合久久不卡电影| 日本久久精品一区二区| 无码精品人妻一区二区| 亚洲欧美日韩一区二区三区在线| 夜夜爽99久久国产综合精品女不卡| 69成人免费视频| 一本大道综合伊人精品热热| 少妇高潮大叫好爽喷水| 天堂va蜜桃一区二区三区 | 国产麻豆一精品一男同| 日韩视频中文字幕| 国产午夜福利一区| 欧美日韩亚洲系列| 日韩精品大片| 国产精品高潮呻吟久久久| 亚洲欧美色综合| 午夜精品福利一区二区| www.黄色小说.com| 亚洲国产成人91精品| 手机在线看片日韩| 欧美午夜女人视频在线| 日本高清视频免费在线观看| 亚洲第一色视频| 国产精品免费久久久久久| 九九热在线视频播放| 亚洲天堂精品在线观看| 国产伦精品一区二区三区四区视频_| 91天堂素人约啪| 国产精品免费视频xxxx| 亚洲精品男人天堂| 在线国产精品视频| 美女黄页在线观看| 性色av一区二区三区红粉影视| 极品盗摄国产盗摄合集| 亚洲第一页在线观看| 亚洲一区二区三区乱码aⅴ蜜桃女| 国产99对白在线播放| 99伊人久久| 黄色一级a毛片| 91在线精品视频| 亚洲人午夜射精精品日韩| 国产乱肥老妇国产一区二 | 九九热在线免费观看| 伊人久久五月天| 国产免费一区二区三区免费视频| 久久免费视频观看| 日韩中文字幕高清| 欧美日产一区二区三区在线观看| 国产性色一区二区| 91看片在线免费观看| 亚洲影院在线观看| 久久国产黄色片| 国产91色在线| 国产福利一区二区| 中文字幕永久免费| 正在播放欧美视频| 国产小视频在线看| 久久久视频免费观看| 成人av在线网| 麻豆短视频在线观看| 日韩一区二区免费在线观看| 日本美女xxx| 4p变态网欧美系列| 精品国产亚洲av麻豆| 国产性生活免费视频| 欧美人妇做爰xxxⅹ性高电影| 成熟的女同志hd| 色999日韩自偷自拍美女| 色香蕉成人二区免费| 亚州国产精品视频| 福利视频久久| 日韩精品一区二区三区swag| 国产夫妻在线观看| 自拍偷拍99| 67194成人在线观看| 天天操天天干天天插| 日韩中文字幕二区| 日韩hd视频在线观看| 国产乱码精品一区二区三区av| 在线观看国产免费视频| 久久久视频在线| 亚洲精品视频在线观看免费| 色偷偷www8888| 国产精品播放| 一区视频在线播放| 国产又粗又大又黄| 激情高潮到大叫狂喷水| 国产福利一区视频| 亚洲春色综合另类校园电影| 国产一区玩具在线观看| 亚洲午夜久久久久| 国产精品国产精品国产专区| 成人午夜剧场视频网站| 91插插插插插插插插| 青青草综合视频| 国产高清自拍99| 亚洲女女做受ⅹxx高潮| 精人妻无码一区二区三区| 日本男人操女人| 91精品在线影院| 欧美一区二区成人| 亚洲素人一区二区| 亚洲无人区一区| 国产精品区一区二区三区| 热久久免费视频| 五月激情六月婷婷| 日本亚洲色大成网站www久久| 国产真人做爰毛片视频直播| 国产呦系列欧美呦日韩呦| 147欧美人体大胆444| 国产精品一区二区三区久久| 欧美成人亚洲成人日韩成人| 色吧影院999| 这里只有精品在线观看| 亚洲欧美中文日韩v在线观看| 欧美麻豆精品久久久久久| 久久精品视频网| www激情久久| 国产精品网站导航| 麻豆91在线播放| 日韩一区二区三区在线观看视频| 久久久精品毛片| 久热这里只有精品6| 国产51自产区| 黄色a级三级三级三级| 亚洲春色在线| 欧美一区二区在线视频观看| 4444欧美成人kkkk| 欧美三区免费完整视频在线观看| 成人激情免费电影网址| 一区二区三区欧美| 午夜视频久久久久久| 国产99久久久久| 久久精品免费看| 成人h动漫精品| 欧美日韩一区久久| 久久久久久香蕉网| 尤物网站在线观看| 99久久99久久精品免费观看| 精品久久久久av影院| 日本国产一区二区三区| 国产精品男人的天堂| www久久99| 成人在线观看www| 麻豆精品国产传媒av| 国产麻豆a毛片| 亚洲AV无码乱码国产精品牛牛| 不卡av在线网| 国产精品毛片无遮挡高清| 国产精品高清亚洲| 欧美日韩国产在线观看| 国产在线精品一区免费香蕉| 国产一级大片免费看| 国产一二三四五| 99精品视频国产| 国内精品久久久久久久久久| 国产精品久久久久久久久图文区 | 日本丰满少妇黄大片在线观看| aaa一级黄色片| 影音先锋国产在线| aaa欧美日韩| 欧美成人激情免费网| 国产伦精品一区二区三| 国产精品无码电影在线观看| 亚洲国产天堂av| 久久综合伊人| 性感美女极品91精品| 日韩精品中文字幕在线播放| 91精品久久久久久久久久另类| 国产高清www| 国产调教打屁股xxxx网站| 丰满少妇高潮一区二区| 中文字幕av第一页| 国产99精品在线观看| 亚洲精品伦理在线| 亚洲美女性视频| 成人免费淫片视频软件| 99在线免费视频观看| 日韩三级小视频| 欧美色偷偷大香| 97精品一区二区视频在线观看| 在线观看欧美一区二区| 亚洲欧美另类综合| 国产一区二区三区久久精品| 国产亚洲精品精品精品| 91精品一区二区三区在线观看| 美女网站视频黄色| 91啪九色porn原创视频在线观看| 成人网在线观看| 久久久久久久久久免费视频| 国产精品1区二区.| 高清在线视频日韩欧美| 中文字幕一区二区三区精彩视频| 日本三级理论片| 亚洲国产精品欧美一二99| 国产精品一区二区欧美| 特级西西444www高清大视频| 国产精品久久久久精k8 | 亚洲3atv精品一区二区三区| av鲁丝一区鲁丝二区鲁丝三区| 黄色片中文字幕| 丁香激情综合五月| 久久99国产精品自在自在app| av资源站久久亚洲| 秋霞网一区二区三区| 国产精品一二三| 久久av资源网站| www.污污视频| 国产成人av影院| 亚洲视频在线观看网站| 99蜜桃臀久久久欧美精品网站| 精品人妻伦一二三区久久| 欧洲另类一二三四区| 日本免费高清一区| 一区二区小视频| 日韩精品福利在线| 天美一区二区三区| 久久久av毛片精品| www.日韩欧美| www.日本一区| 久久99蜜桃精品|