亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

Mamba提出者再次挑戰Transformer,或成為通用基礎模型核心架構

IP屬地 中國·北京 編輯:楊凌霄 DeepTech深科技 時間:2025-07-12 20:17:03

作為美國卡內基梅隆大學的助理教授和美國 AI 初創公司 Cartesia 的聯合創始人,Albert Gu 曾憑借聯合提出 Mamba 這一新型序列建模架構而入選 TIME 100 AI,還曾入選 2025 谷歌研究學者計劃名單。


圖丨Albert Gu(https://memento.epfl.ch/event/ai-cente)

最近,他和自己的韓裔學生黃錫俊(Sukjun Hwang)以及 Cartesia 技術團隊的華裔成員 Brandon Wang 提出了一種端到端的分層網絡(H-Net,hierarchical network)。


圖丨黃錫俊(Sukjun Hwang)(https://sukjunhwang.githu)

值得注意的是,作為一名華裔,本次相關論文的共同作者 Brandon Wang 高中畢業于美國加利福尼亞州的薩拉托加(Saratoga)高中,后于 2019 年獲得國際數學奧林匹克競賽(IMO,International Mathematics Olympiad)金牌,2024 年其本科畢業于美國麻省理工學院,之后便加入了 Albert Gu 的上述創業公司。


(資料圖)



首個真正端到端無分詞器的語言模型

研究團隊表示,H-Net 通過遞歸的、數據依賴的動態分塊(DC,dynamic chunking)過程對原始數據進行壓縮,代表了首個真正端到端無分詞器的語言模型。該模型通過單階段動態分塊,當字節級的 H-Net 在參數規模超過 10 億時,其困惑度和下游任務性能可與基于字節對編碼(BPE,Byte Pair Encoding)分詞的 Transformer 模型相媲美。


圖丨相關論文(arXiv)

據了解,H-Net 在保持分詞化流程效率的同時,通過使用數據驅動、內容感知且上下文相關的分割機制,來取代人工設計的啟發式規則,從而能夠顯著提升建模能力。

H-Net 采用了先前研究中的分層架構,這有些類似于自回歸 U-Net:首先,原始數據由一個小型編碼器網絡進行處理;然后,進行下采樣并傳入在壓縮塊上運行的主網絡;最后,進行上采樣并傳入在原始分辨率上運行的解碼器網絡。這種模塊化設計構建了一個自然的處理層級結構,即外層階段捕捉細粒度模式,而內層階段則基于類似于傳統分詞的粗粒度表示進行運算。盡管主網絡包含大部分參數,但是研究團隊發現編碼器和解碼器網絡通過使用狀態空間模型(SSM,state space model)能得到顯著改進,因為 SSM 具有用于壓縮的歸納偏置。

據介紹,H-Net 的核心在于采用了一種新穎的動態分塊(DC,dynamic chunking)機制,該機制能夠連接主網絡與編碼器/解碼器網絡,在使用標準可微優化算法的同時,可以學習如何對數據進行分割。

動態分塊技術由兩種互補的新技術組成:首先是一個路由模塊,該模塊通過相似度分數預測相鄰元素之間的邊界;其次是一個平滑模塊,該模塊利用路由模塊的輸出對表示進行插值,以此減弱不確定邊界帶來的影響,并能顯著提升可學習性。

研究團隊還結合了以下創新技術:第一,結合針對目標降采樣率設計的新型輔助損失函數;第二,結合基于梯度的離散決策現代學習技術。基于此,動態分塊讓 H-Net 能以完全端到端的方式學習數據壓縮方法。

研究團隊還引入了幾種架構和訓練技術,以便提高端到端優化過程中的穩定性和可擴展性。這些措施包括:一方面,精心設置投影層和歸一化層,以便平衡交互子網絡之間的信號傳播;另一方面,根據每個層的維度和有效批大小調整優化參數,而這些參數在層級結構的不同階段會發生變化。據介紹,H-Net 通過學習與主干網絡共同優化的分割策略,根據上下文信息動態地將輸入向量壓縮成有意義的塊。研究團隊在論文中寫道,從經驗上看,動態分塊模塊會自然地將數據壓縮到與 BPE 分詞器相近的分辨率(4.5-5 字節/塊),并且能定性地學習到有意義的邊界,整個過程無需任何外部監督或啟發式方法。


(arXiv)



此前的端到端方法存在訓練不穩定性

據了解,深度學習的一個整體目標是從原始數據中學習有意義的模式,以端到端的方式自動提取特征并構建抽象概念。然而,固定詞匯分詞——即通過 BPE 等算法將原始文本壓縮成預定義塊的過程,仍然是現代語言模型中普遍存在的手工預處理步驟。

分詞存在諸多已被充分證實的缺陷:字符級理解能力薄弱、缺乏意義和可解釋性,以及在復雜語言和模態上性能會出現下降等。而使用單一的端到端模型取代分詞-語言模型-去詞化流程,也更加符合深度學習的本質。理想情況下,隨著數據和參數的增加,其擴展能力也會更強。

然而,分詞仍是語言模型和其他序列數據中不可或缺的組成部分,因為它能夠對序列進行壓縮和縮短。截至目前,在計算資源相當的情況下,還沒有任何端到端的無分詞器模型能達到基于分詞器的語言模型的性能水平。

近期的一系列研究開始致力于克服自回歸序列模型中的分詞問題,但這需要解決一系列復雜的技術挑戰。盡管可聯合訓練的邊界預測器是理想的解決方案,不過它們需要在無監督的情況下優化離散選擇操作,這從根本上而言是一個極具挑戰性的問題。因此,現有的端到端方法存在訓練不穩定性,這使得模型無法擴展到更大規模,也無法嵌套多級層級結構。

從根本上講,創建無分詞器架構需要將數據分塊過程直接整合到模型中,同時克服大規模場景下在效率、可學習性和穩定性方面的挑戰。基于此,研究團隊開展了本次研究。



有望成為通用基礎模型的核心架構

研究團隊在論文中表示,除了解決分詞問題外,H-Net 在多種場景下改進了通用序列建模。分塊是從低級數據構建高級抽象概念的過程,而語言模型中的子詞分詞是分塊的一種特殊情況,同時也是智能的核心組成部分。

更重要的是,由于 H-Net 是完全端到端的,因此它可以遞歸迭代,同時主網絡本身也可以是一個 H-Net。從直觀上看,更多的分塊階段代表著更高階的含義。就像字符可以組合成單詞一樣,單詞也可以組合成從句、句子,乃至更復雜的單位。所以,對層次結構進行迭代應該能夠實現計算資源和參數的更高效利用,并能更有效地對壓縮后的表示進行推理。研究團隊表示,H-Net 代表了一種新型的基礎模型架構,它不僅克服了分詞問題,還能發現并處理從原始數據中學習到的抽象特征,從而在更少的預處理情況下構建出更高質量的模型。

當將 1 階段 H-Net 迭代為 2 層級階段,其性能得到進一步提升,且顯著優于所有基線模型,不僅訓練曲線更陡峭,在數據擴展方面也表現更佳。字節級的 2 階段 H-Net 僅用 300 億訓練字節就超越了性能強勁的分詞 Transformer 的困惑度,且這一差距在整個訓練過程中不斷擴大,同時其下游任務評估結果與規模為其兩倍的分詞 Transformer 相當。

而由于 H-Net 中的編碼器和解碼器網絡具有雙重目標和計算需求,因此它們面臨著獨特的設計約束。每個編碼器必須同時做到以下兩點:其一,通過殘差連接保留細粒度信息,以傳輸至其對應的解碼器;其二,將輸入壓縮成具有更豐富表示的塊,以供主網絡使用。同時,解碼器必須有效地將主網絡的粗粒度表示與編碼器殘差的細粒度細節結合起來。同樣重要的是,編碼器和解碼器均作用于未壓縮的序列,這使得計算效率成為一項顯著的設計約束,進而影響著研究團隊的架構選擇。

近期有研究表明,SSM 在處理包括音頻、DNA 序列和機器人控制信號在內的細粒度數據方面表現出色。基于這些見解,研究團隊采用 Mamba-2 層作為編碼器和解碼器網絡的主要構建模塊。這一選擇帶來了兩個顯著的好處:一是能夠有效處理細粒度的輸入,二是在處理較長且未壓縮的序列時效率得到了大幅提升。消融實驗表明,基于 SSM 的編碼器/解碼器不僅在字節級別上顯著優于 Transformer 層,甚至在更粗糙的輸入上也是如此,研究團隊認為這歸因于它們對壓縮具有更強的歸納偏置,因此有助于構建抽象表示。

這一設計體現了兩個關鍵原則:首先,壓縮序列使得每個塊能夠分配到更多的參數和計算資源;其次,更高層次的抽象化受益于增強的處理能力。

主網絡起到標準語言模型的作用,并且可以采用任何序列混合架構。研究團隊默認使用 Transformer 層有兩個原因:第一,壓縮表示與 Transformer 在處理離散、語義豐富的 tokens 方面的優勢高度契合;第二,實驗中能夠與傳統基于 BPE 的 Transformer 基線進行更可控的比較。不過,這種模塊化設計也允許直接替換為其他架構。


(arXiv)

與標準各向同性模型相比,H-Net 的結構引入了多個新的架構參數維度,以便平衡每個網絡的參數/計算分配。最終,H-Nets 實現了以下優勢:

其一,它具備較好的魯棒性:在無需特殊數據混合的情況下,經過預訓練的 H-Net 對文本擾動的魯棒性顯著優于基于分詞的 Transformer,這一點在含噪聲的 HellaSwag 基準測試套件上得到了驗證。

其二,它具備較好的可解釋性:通過對學習到的邊界進行定性可視化分析,研究團隊發現 H-Net 能夠自動識別語義連貫的單元,同時無需顯式監督。這驗證了端到端學習可以成功檢測出傳統上通過人工分詞強加的結構模式。

其三,它在其他語言上具有優勢:H-Net 帶來的改進在那些缺乏明顯分割線索的語言上更為顯著(包括中文和代碼)。在 XWinograd-zh 數據集上,相比基于分詞的 Transformer,H-Net 的分數從 59.9 提升至 66.3。在 DNA 語言建模中也是如此,與各向同性模型相比,H-Net 的數據效率提升了 3.6 倍。


(arXiv)

總的來說,H-Net 大幅改善了分詞器存在的問題,在多種語言及類語言模態上展現出極強的性能,研究團隊認為它有望成為通用基礎模型的核心架構,讓這些模型以更少的處理量實現更高效的學習。目前,研究團隊已經開源了模型代碼和預訓練檢查點。

參考資料:

https://time.com/7012853/albert-gu/

https://cartesia.ai/

https://sukjunhwang.github.io/

https://www.linkedin.com/in/brwa/

https://br-wa.github.io/#top

https://www.linkedin.com/in/albert-gu-8ab677139/

https://goombalab.github.io/

https://arxiv.org/pdf/2507.07955v1

排版:劉雅坤

免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

欧美日韩你懂得| 成 年 人 黄 色 大 片大 全| 久久国产在线视频| 91麻豆国产精品| 国产精品久久久久99| 国产一区二区丝袜| 久热精品在线观看视频| 熟女人妻在线视频| 91成品人影院| 亚洲午夜精品久久久| 国产黄色一级网站| 亚洲精品一区二区毛豆| 亚洲一区二区在线看| 一区二区三区国产| 久久精品国产精品亚洲红杏| 成人av资源在线| 午夜免费福利视频| 91国模少妇一区二区三区| 欧美福利视频在线观看| 亚洲精品视频播放| 欧美一区二区三区喷汁尤物| 日韩美女写真福利在线观看| 亚洲五月六月| 男人网站在线观看| www.xx日本| 激情文学亚洲色图| 国内精品在线观看视频| 国产日韩欧美大片| 日韩精品在在线一区二区中文 | 日韩在线视频不卡| 激情综合色丁香一区二区| 天堂成人在线观看| 久久中文欧美| 日产电影一区二区三区| 久草福利在线观看| 天天干天天舔天天操| 国产99久久久久久免费看农村| 在线不卡的av| 先锋影音网一区| 午夜69成人做爰视频| 国产无遮挡又黄又爽又色| 日韩av在线播放不卡| 免费成人进口网站| 中文字幕美女视频| 亚洲婷婷综合久久一本伊一区| 成人综合在线网站| 成人精品免费视频| aaa国产一区| 无码久久精品国产亚洲av影片| 成人免费视频国产免费| 欧美日韩中国免费专区在线看| 一区二区高清在线| 7799精品视频| 日韩av在线最新| 亚洲综合网站在线观看| 亚洲欧美制服第一页| 成人性色av| 国产91精品看黄网站在线观看| 精品女厕一区二区三区| 久久综合精品一区| 国产高清自拍视频| 黄色a级三级三级三级| 日韩视频在线观看免费视频| 国产三级短视频| 午夜69成人做爰视频| 婷婷五月精品中文字幕| 第四色在线视频| 亚洲欧美另类久久久精品2019| 亚洲一区二区不卡免费| 日韩在线观看免费全集电视剧网站| 免费h精品视频在线播放| 欧美日韩中文另类| 97成人超碰免| 欧美xxxx吸乳| 亚洲欧洲综合在线| 日韩一区二区三区精品视频| 一区二区不卡视频| 日韩中文字幕电影| 中文字幕一二三四区| 手机看片一区二区三区| 午夜国产精品一区| 国产精品国产自产拍高清av| 欧美日韩中文字幕综合视频| 亚洲伊人第一页| 91网站免费入口| 亚欧在线观看视频| av手机免费看| 欧美日韩午夜视频| 一级欧美一级日韩| 色老汉一区二区三区| 久久99精品久久久久子伦| 国产一区二区三区高清播放| 欧美一级黄色录像片| 日日噜噜夜夜狠狠视频欧美人 | 亚洲片国产一区一级在线观看| 亚洲码国产岛国毛片在线| 精品国产91洋老外米糕| 欧美精品在线免费| 久久99国产综合精品女同| 国产va亚洲va在线va| 日韩一级片av| av电影一区二区| 国产精品999999| 在线精品国产欧美| 在线观看亚洲免费视频| 亚洲一区av在线| 成人乱码一区二区三区av| 亚洲黄色有码视频| 影音先锋国产在线| 国产欧美日韩高清| 国产精品视频免费播放| 亚洲欧美激情插| 国产成人综合亚洲| 苍井空张开腿实干12次| 日本一区二区三区久久久久久久久不 | av 日韩 人妻 黑人 综合 无码| 中文字幕第15页| 在线观看国产小视频| 欧美性色欧美a在线播放| 精品产品国产在线不卡| 国产区精品在线| 丝袜情趣国产精品| 久久精品免费网站| 日本少妇xxxx| 狠狠色丁香久久婷婷综合_中| 中文字幕国产精品| 欧美日韩一区二区三区在线观看免| 国产精品区二区三区日本| 免费在线观看黄色av| 日韩中文字幕免费视频| 日本性生活一级片| 亚洲婷婷综合色高清在线| 性欧美亚洲xxxx乳在线观看| 中文字幕在线亚洲精品| 激情综合一区二区三区| 成人免费xxxxx在线观看| 国产成人av资源| 亚洲精品免费一区亚洲精品免费精品一区 | 欧美成人全部免费| 91视频免费版污| av在线这里只有精品| 91免费看片在线| 亚洲AV午夜精品| 日韩理论片在线| 国产91精品久久久久| 午夜18视频在线观看| 精品国产一区二区三区久久| 97色伦亚洲国产| 99久久久国产精品无码免费| 理论片中文字幕| 国产精品永久免费观看| 亚洲 欧美 日韩 综合| 久久av中文字幕| 蜜臀av中文字幕| 欧美另类第一页| 成人小视频在线看| 国产欧美日本一区视频| 99re视频在线观看| 伊人中文字幕在线观看| 中文字幕一区二区三区精华液| 国产成人97精品免费看片| 99re热视频精品| 久久精品免费一区二区| 亚洲国产一区二区三区青草影视| 中国极品少妇videossexhd| 亚洲国产成人91精品| 手机成人av在线| 一区二区三区在线免费观看| 日韩网址在线观看| 日韩天堂在线观看| 成人精品在线播放| 一本之道在线视频| 97人洗澡人人免费公开视频碰碰碰| 精品国产黄色片| 成人h视频在线观看播放| 欧美日韩精品区| 色悠悠久久88| 男女男精品视频网| 国产99午夜精品一区二区三区 | 欧美性大战久久久久| 激情综合色播五月| 国产男女激情视频| 69堂亚洲精品首页| 无码人妻丰满熟妇区毛片蜜桃精品 | 亚洲欧洲一区二区在线观看| 精品久久久久香蕉网| 日韩电影一区二区三区四区| 成人区一区二区| 亚洲一区二区三区爽爽爽爽爽| 精品一区二区视频在线观看| 欧美xxxx做受欧美| 免费观看在线色综合| 久久综合国产精品台湾中文娱乐网| 清纯粉嫩极品夜夜嗨av| 91成人国产在线观看| 亚洲第一成年网| 动漫美女无遮挡免费| 91国内产香蕉| 中文字幕一区二区视频| 国产精品亚发布| 美女视频网站久久| 亚洲成人生活片| 国产免费黄色小视频| 欧美日韩一区二区三区在线视频 | 色偷偷av一区二区三区乱| 亚洲黄色小说网| 新呦u视频一区二区| 亚洲精品在线免费播放| www.日韩高清| 麻豆国产精品va在线观看不卡| 久久香蕉精品视频| 欧美另类交人妖| 国产精品一级视频| 午夜精品美女自拍福到在线| 欧美日韩一卡二卡| 国产一区二区免费看| 国精产品一区一区三区视频| 久久精品国产亚洲一区二区| 中文字幕高清不卡| 久久久久久久欧美精品| 国产草草影院ccyycom| 丁香六月色婷婷| 日本福利一区二区三区| 亚洲无限av看| 成人看片黄a免费看在线| 久久这里只精品| 色在人av网站天堂精品| 99精品欧美一区二区蜜桃免费| 国产真实的和子乱拍在线观看| 成人免费性视频| 黑人巨大精品欧美一区免费视频| 无码av免费精品一区二区三区| 亚洲欧美在线一区| 日韩欧美国产另类| 国产v亚洲v天堂无码| 精品香蕉在线观看视频一| 国产**成人网毛片九色| 美女福利视频网| 精品在线视频一区二区| 色综合天天狠天天透天天伊人| 亚瑟在线精品视频| 日韩欧美有码在线| 亚洲国产91色在线| 久久影视电视剧免费网站清宫辞电视| 伊人久久精品视频| 欧美日韩亚洲一区二区三区| 国产高清在线免费| 亚洲精品国产91| bt天堂新版中文在线地址| 日本久久久a级免费| 精品一区二区三区电影| 久久影院视频免费| 在线播放第一页| 欧美一区二区三区四区在线| 国产亚洲欧洲一区高清在线观看| 国产人与禽zoz0性伦| 国产二区一区| 国产亚洲视频在线观看| 日韩精品福利在线| 日韩精品专区在线影院重磅| 国产日韩精品一区二区三区| 成人av电影免费在线播放| 看片的网站亚洲| 中文区中文字幕免费看| 亚洲精品国产精品乱码在线观看| 成人免费视频久久| 亚洲一区精彩视频| 久久久久久午夜| 欧美丰满少妇xxxxx| 欧美一级日韩免费不卡| 欧美日韩在线综合| 亚洲国产高清aⅴ视频| 69精品无码成人久久久久久| 日韩av影视| 九色成人免费视频| 91国产福利在线| 国产精品一区二区果冻传媒| 超碰免费在线97| 探花国产精品一区二区| 久久久久99精品| 一级黄色大片免费看| 肉丝美足丝袜一区二区三区四| 在线精品视频播放| 香蕉视频一区二区| 久久精品国产**网站演员| 91福利社在线观看| 午夜剧场成人观在线视频免费观看| 999视频在线免费观看| 国产精品免费久久久| 奇米成人av国产一区二区三区| 精品国产乱码久久久久久蜜臀| 日韩一级成人av| 亚洲精品国产精品国产自| 亚洲区中文字幕| 亚洲国产高清自拍| 日本一区二区三区久久久久久久久不| 一级片免费网站| 美女的奶胸大爽爽大片| 杨幂一区二区国产精品| 日韩手机在线观看视频| 久久久水蜜桃| 精品视频无码一区二区三区| 久久久久麻豆v国产精华液好用吗| 91蝌蚪视频在线| 免费观看黄网站| 久久久99精品| 日本不卡高清视频| 日韩电影第一页| 在线综合视频网站| 在线免费观看av网址| 亚洲国产高清在线| 欧美激情精品久久久久久久变态| 国产精彩精品视频| 国产欧美日韩伦理| 免费在线观看一区二区| www.四虎成人| 可以免费看av的网址| 免费视频网站在线观看入口| 蜜臀99久久精品久久久久久软件| 国产精品午夜免费| 国产综合久久久久久鬼色| 免费观看一级特黄欧美大片| 免费在线看成人av| 99这里只有精品| 亚洲欧美另类小说| 色婷婷综合久色| 国产精品黄页免费高清在线观看| 日韩精品在线视频免费观看| 任我爽在线视频| 国产精品免费无遮挡无码永久视频| 久久99日本精品| 色综合久久中文综合久久97| 欧美日韩国产成人高清视频| 黄色一级片网址| 欧美a在线播放| 伊人网免费视频| 成人久久视频在线观看| 综合色天天鬼久久鬼色| 精品无人区乱码1区2区3区在线 | 亚洲男人的天堂在线aⅴ视频| 91极品美女在线| 日韩一级黄色大片| 日韩中文字幕免费视频| 国产精品美女主播| 色综合视频二区偷拍在线| 亚洲精品在线视频播放| 精品无码av在线| 黑人巨大精品欧美黑白配亚洲| 日本乱码高清不卡字幕| 精品一区二区三区日本| 青青青青草视频| 人人澡人人澡人人看| 日韩一区日韩二区| 欧美福利视频网站| 欧美深夜福利视频| 国产露脸国语对白在线| 亚洲婷婷国产精品电影人久久| 亚洲欧美在线免费| 成人看片视频| 久久婷婷中文字幕| 精品综合免费视频观看| 欧美精品高清视频| 国内精品久久国产| 久久久久久草| 国产一伦一伦一伦| 天天操天天射天天爽| 成人免费高清在线| 日韩大陆毛片av| 欧美亚洲国产免费| 实拍女处破www免费看| 蜜臀av性久久久久蜜臀aⅴ流畅| 日韩精品一区二区三区视频在线观看| av成人综合网| 日本视频在线观看免费| 亚洲蜜臀av乱码久久精品蜜桃| 66m—66摸成人免费视频| 麻豆av免费观看| 国产精品天天摸av网| 亚洲国产精品久久久久久女王| 久久久777| 5566日本婷婷色中文字幕97| 欧美人与禽zozzo禽性配| 精品国产一区二区三区忘忧草 | 国产区日韩欧美| 国产真人无遮挡作爱免费视频| 久久精品999| 国自产精品手机在线观看视频| 久久亚洲AV无码专区成人国产| 91小视频免费看| 草莓视频一区| 成人免费看片98| 久久精品视频一区| 96sao精品视频在线观看| 在线观看免费国产视频| 永久免费精品影视网站| 国产成人自拍视频在线| 欧美少妇一区二区| 天天在线免费视频| 麻豆国产欧美一区二区三区| 欧美成aaa人片免费看| 视频国产一区二区| 日本一区二区视频在线| 日韩中文有码在线视频| 中文在线观看免费视频| 精品欧美国产一区二区三区| 成年人视频观看| 亚洲人成人无码网www国产| 搡的我好爽在线观看免费视频| 欧美大尺度做爰床戏| www.日本久久|