亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

跳過“逐字生成”!螞蟻趙俊博:擴散模型讓我們能直接修改Token

IP屬地 中國·北京 量子位 時間:2025-12-12 14:18:21

當主流大語言模型還在采用自回歸架構時,有人已經盯上了擴散架構。

在本次量子位MEET2026智能未來大會上,浙江大學百人計劃研究員、博士生導師,螞蟻集團資深技術專家趙俊博表示:

擴散架構在推理過程中可以直接修改和控制token,而不需要像自回歸模型那樣重新生成整段內容。

這意味著,相比自回歸模型,擴散模型理論上有望實現更快的生成速度以及更低的計算成本。

基于此,他和團隊將重點押注于擴散架構,并致力于探索擴散語言模型獨有的Scaling Law。

而作為這一探索的關鍵里程碑,他們近期發布并開源了LLaDA 2.0,率先將擴散語言模型做到千億體量

趙俊博坦言,該領域在訓練與推理層面仍處早期,但發展勢頭迅猛,已吸引包括谷歌、字節在內的巨頭及一批初創公司積極布局。

編者注:就在MEET2026智能未來大會結束后,趙俊博和團隊也發布了全新的技術報告,揭示了千億體量擴散語言模型背后的關鍵技術選擇。
報告標題:LLaDA2.0: Scaling Up Diffusion Language Models to 100B
報告鏈接(github):https://github.com/inclusionAI/LLaDA2.0/blob/main/tech_report.pdf



為了完整體現趙俊博的思考,在不改變原意的基礎上,量子位對演講內容進行了編輯整理,希望能給你帶來更多啟發。

MEET2026智能未來大會是由量子位主辦的行業峰會,近30位產業代表與會討論。線下到場參會觀眾近1500人,線上直播觀眾350萬+,獲得了主流媒體的廣泛關注與報道。

核心觀點梳理

所有生成模型本質上都是在擬合數據分布。自回歸模型提供了一種擬合方式,它將整體分布拆解為一系列遵循單向因果順序的條件概率來逐步建模。但這種方式并不是唯一的路徑開源模型LLaDA采用擴散語言模型架構,暫不考慮MoE的情況下,在相同的計算量和性能目標下,LLaDA所需的參數規模可以比自回歸模型更小擴散架構在推理過程中可以直接修改和控制token,而不需要像自回歸模型那樣重新生成整段內容。在計算受限情況下,LLaDA采用“完形填空”式預測,相比自回歸模型更為“data-hungry”,對數據需求更大、吸收數據更快LLaDA與自回歸模型的Scaling Law存在差異,已驗證LLaDA可以擴展到千億規模,但繼續往上會面臨新的挑戰。

以下為趙俊博演講全文:

押注擴散語言模型的Scaling Law

大家好,今天我稍微講點不一樣的,來一場技術上的脫口秀。

剛才幾位嘉賓已反復提及,目前主流的大語言模型幾乎都基于自回歸架構構建。但我接下來介紹的,我們最近開源的全新系列模型——架構完全不同

要想了解不同之處何在,先讓我們來厘清幾個基本概念。

相信大家都很熟悉Midjourney、Sora、Emu Video等圖像/視頻賽道的熱門模型,實際上,它們里面都有一個非常明確的機制叫擴散

何謂擴散?簡單來說就是加噪后再去噪,從噪聲中恢復圖像。

所有的Auto-Regressive Model(AR,自回歸模型)基本都遵循同一機制——給定前N個詞,要求模型預測并生成第N+1個詞,然后基于前N+1個詞,再去預測第N+2個詞,依此類推。

而擴散語言模型另辟蹊徑,可能有些觀眾也知道這個東西叫Masked Diffusion Language Models,我們看一下它的解碼過程,簡單來說它的機制不是“做接龍”,而是“做完形填空”

如圖所示,給定一句話之后我們會Mask(遮蓋)掉一部分詞,再讓它恢復,這就非常像我們小時候做的完形填空。



而我們現在要做的,就是Diffusion Language Model(dLLM,擴散語言模型)的Scaling Law。

為什么做這件事?其實這是我們的一個賭注。

本質上來說,所有的大模型只要是生成模型,都是對P(X),也就是對本身數據分布的擬合。

自回歸模型提供了一種擬合方式,它將整體分布拆解為一系列遵循單向因果順序的條件概率來逐步建模。但這種方式并不是唯一的路徑。

下圖由新加坡國立大學SEA AI研究員Jinjie Ni提供,里面點明了幾個非常重要的觀點。

第一,在計算受限的情況下,基于“完形填空”這一方式進行預測的擴散語言模型,比一般的自回歸模型需要的數據量更大,即所謂的“data-hungry”,在數據上能吃得更快。



第二,同樣是dense結構(先不管MoE),在參數和計算量相同的情況下,其實dLLM可以做得比AR更小。

所謂的“Super Data Learners”,如果了解圖像或視頻的擴散模型就會知道,它們有個特點——你可以一直訓練

比如我們現在所有的自回歸模型,基本上訓練到多個epoch,效果就不再變動,數據也就這樣了。

而在同樣數據集、同樣架構下,紅色那條代表Diffusion的曲線可以一直訓——跟圖像領域觀測到的現象一致,確實可以一直做訓練。



第三是Diffusion獨有的優勢。都知道CoT(思維鏈)和RL(強化學習),或者說見識過DeepSeek上的深度思考過程。這個東西我之前做了個比喻,AR像一個不能帶草稿紙的考生:

進了考場之后不允許寫提綱,跟下棋一樣落子無悔,在解所有題的時候落筆無悔。寫下一個token就釘死,再寫下一個,沒有給你任何機會回頭修改。中間寫錯了有一個CoT的機制,就好像“突然有一個token說這個地方好像中間有一步算錯了,我再重新開始”。

實際上這就解釋了為什么會有test-time scaling——AR在推理側的token efficiency其實并不高,有一些簡單的問題也要推理很久,生成很多token。

如圖所示,我們正在進行的研究叫Editable and Controllable Generation(等待跑通中),是指在Diffusion框架下,隨時“做完形填空”、隨時改;不像DeepSeek-R1或OpenAI-o1必須整段token推倒重來,我們可以直接在推理過程里改token。



這個東西有大量的工程細節,時間關系我只能簡單放一些。

發布并開源千億規模dLLM

首先是注意力掩碼(Attention Mask)的適配問題

我們的模型中既包含細粒度的Block,也包含由Block組成的更大區塊——區塊之間采用自回歸的注意力機制(確保序列的總體連貫性),區塊內部并行解碼(以提升計算效率)。

因此,模型中同時存在兩種注意力模式。有些地方用全局Attention(以捕捉長程依賴),有些地方用Causal Attention(以維持自回歸約束)。

這里頭還包括對隨機長度序列的處理、集成港大孔令鵬老師提出的幾何加權方法,以及實現文本與文檔的長序列切分注意力等關鍵技術。

我們開源了一套訓練框架和推理框架,讓社區能把我們在Hugging Face上發布的模型直接跑起來。其中涉及5D并行集成、分區塊Diffusion下的Flex-Attention與Attention Mask適配,細節不再展開。

這是我們開源的第一個面向擴散語言模型的訓練框架,已支持SFT(監督微調)與DPO(直接偏好優化)。



這里我想把整個脈絡稍微介紹一下:

中國人民大學文繼榮和李崇軒老師團隊,率先開源了擴散語言模型LLaDA的第一個版本LLaDA 1.0。

LLaDA 1.0的研究過程非常痛苦,當時訓練和推理框架都很原始,踩坑無數,不過其8B版本在Hugging Face上零推廣就拿到二十幾萬下載。

這是第一個大規模訓練到80億參數的擴散語言模型,效果可對標LLaMA-3-8B。

后來螞蟻技術研究院聯合人大、浙大、西湖大學把整條線接過來,下重注要把這個領域的一些“非共識”變成“共識”。

第一件事就是解決架構問題。LLaDA是一個dense模型,而dense的痛點大家都提過,比如第一個就是怎么在Diffusion的框架里集成MoE。

今年9月,我們發布了LLaDA-MoE,總參數7B(激活參數1B),是全球第一個原生訓練出來的MoE架構擴散語言模型。

最近一段時間,相關研究幾乎已經在全球鋪開——谷歌有Gemini Diffusion、有家美國創業公司在做Mercury系列,包括字節也在做。

其最大特點就是一個字:

因為它就是“做完形填空”。比如做一個解碼,我先把最后一個token解出來,然后再去填中間,這些東西確實是實際解碼過程中能看到的。

上上周,我們發布了LLaDA 2.0,率先把擴散語言模型做到千億體量。踩坑史太長,技術報告已上線,這里就不再展開。



這里有幾個視頻。

第一個視頻表明,在全局注意力機制的支持下,擴散模型在效果上相比自回歸模型具備一定優勢。



轉到Coding,現在比較神奇的一點是——擴散語言模型在“調用”和“寫代碼”這兩個任務上比自回歸模型有明顯優勢

得益于并行解碼,一次能同時吐出幾個token,現場看起來就像你在Cursor里按Tab自動補全。這些行為全是模型自己學出來的,我們也沒完全搞懂為啥。



以及再看文學創作,這個東西比較有意思。看一下這個解碼過程,先把開頭和結尾的框架定下來,中間部分先寫個大概,然后再根據上下文反復修改、潤色中間的內容。



這種“非共識”的解碼軌跡,在Gemini、OpenAI等任何原生App里都看不到。

接下來的一兩個月,我們會聯合ZenMux(一站式模型接入平臺)放出部分API,體量雖還比不過主流大模型,但社區已在慢慢長大。

dLLM的訓練推理仍處于早期發展階段

最后用一點時間聊下推理。

10月份左右,我們發布了一個帶有試驗性質的推理引擎dInfer

通過新的模型架構與范式,若能將關鍵場景的TPS推上千量級,實現五倍乃至更高的速度提升,其體驗將是革命性的。

回頭看,Data/Parameter Scaling Law已不新鮮,去年9月OpenAI又帶出testing-time Scaling Law。

接下來會不會出現Diffusion Scaling Law?

今天沒人能給出答案。唯一確定的是,dLLM與AR的Scaling Law有很大區別,繼續擴展下去也會面臨新的挑戰。

但不管怎樣,我們會在這條路上繼續走下去。在我看來,AR發展了三年(從ChatGPT出來之后發展了三年),dLLM的訓推生態才剛起步,希望社區一起下場共建,謝謝。

免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

全站最新
国产精品一 二 三| 亚洲另类在线观看| 欧美综合在线观看| 欧美性一级生活| 欧美激情一区二区三区全黄| 亚洲精品91在线| 伊人网视频在线| 国产高潮在线观看| 国产ts人妖一区二区| 中文字幕高清一区| 欧美激情国内偷拍| 中文字幕在线播放一区二区| 神马久久久久久久久久| 污片在线观看一区二区| 欧美精品一区二区三区视频| 久久亚洲精品一区| 久久久久中文字幕| 91久久久久久久一区二区| 国产成人+综合亚洲+天堂| 欧美精品一区二区三区蜜桃视频| 亚洲网站在线看| 日韩区在线观看| 亚洲综合一区二区不卡| 日韩视频在线观看国产| 国产精品美女在线播放| 蜜臀av粉嫩av懂色av| 91久久国产综合| 亚洲国产av一区二区三区| 国产手机精品视频| 国产福利不卡视频| 国产在线精品一区二区夜色 | 精品一区二区日韩| 丰满岳乱妇国产精品一区| 亚洲免费观看高清完整版在线 | 91av俱乐部| 国产一区二区麻豆| 欧美精品日日鲁夜夜添| 夜夜春亚洲嫩草影视日日摸夜夜添夜| 日本三级2019| 极品少妇xxxx精品少妇偷拍| 亚洲理论在线观看| 琪琪亚洲精品午夜在线| 亚洲一二三四五| 国产这里有精品| 亚洲午夜福利在线观看| 在哪里可以看毛片| 蜜桃视频最新网址| 狠狠狠色丁香婷婷综合激情 | 欲求不满的岳中文字幕| 国产精品无码久久av| 日韩欧美一区电影| 久久久久无码精品| 狠狠躁夜夜躁人人爽天天天天97| 欧美一区二区福利| 三级黄色片网站| 国产一区二区三区影院| 99麻豆久久久国产精品免费优播| 在线视频一区二区免费| 欧美高清视频免费观看| 99久re热视频精品98| 国产ts在线观看| 国产欧美日韩不卡免费| 成人在线视频电影| 国产 中文 字幕 日韩 在线| 婷婷久久综合九色综合伊人色| 欧美成人一级视频| 国产精品中文久久久久久久| 污污的视频免费观看| 日批视频在线播放| 一区二区三区免费在线观看| 色噜噜亚洲精品中文字幕| 国模一区二区三区私拍视频| 亚洲av无码专区在线播放中文| 天天射天天色天天干| 中文字幕9999| 91免费观看网站| 91精品91久久久中77777老牛| 永久免费看片直接| 欧美最猛黑人xxxxx猛交| 97精品国产97久久久久久粉红| 日产国产高清一区二区三区| 日本韩国欧美三级| 精品国产免费人成在线观看| 天堂网在线免费观看| 天天操天天操天天| 国内视频一区二区| 亚洲色图一区二区三区| wwwjizzjizzcom| 老司机午夜免费精品视频| 在线播放中文一区| 麻豆精品国产传媒| 亚洲精品视频在线| 婷婷视频在线播放| 国产乱人伦精品一区二区在线观看| 亚洲性日韩精品一区二区| 国内精品二区| 偷拍夫妻性生活| 成人一区二区三区视频在线观看| 亚洲影院久久精品| 国产精品国产精品| 香蕉国产在线视频| 在线一区二区观看| 污污动漫在线观看| 午夜久久久久久久久| 在线天堂一区av电影| 精品在线免费观看| 一区二区三区视频网| 欧美日韩一级片网站| 亚洲精品乱码视频| 天码人妻一区二区三区在线看| 亚洲欧美日韩国产精品| 色欲色香天天天综合网www| 91丨九色丨海角社区| 欧美三级xxx| 中国人与牲禽动交精品| 久久久久久久久久久99| 国产在线综合网| av电影在线观看一区| 三年中文高清在线观看第6集 | 一本大道久久加勒比香蕉| 成人午夜精品久久久久久久蜜臀| 久久精品欧美一区二区三区麻豆| 久久人91精品久久久久久不卡| 亚洲二区在线播放| 日韩欧美aⅴ综合网站发布| 奇米精品一区二区三区| 性一交一乱一精一晶| 一区二区三区中文字幕| 美国av在线播放| 在线一区二区三区做爰视频网站| 欧美人妻一区二区三区| 亚洲国产精品va在线观看黑人| 国产成人一区二区三区别| 国产成人啪精品午夜在线观看| 欧美日韩一区久久| av在线网站观看| 久久露脸国产精品| 国内精品国产三级国产a久久 | caoporen国产精品| 亚洲自拍第二页| 亚洲天堂网在线观看| 一级特级黄色片| 日韩成人在线视频网站| 国产精品va无码一区二区| 久久嫩草精品久久久久| 中国china体内裑精亚洲片| 日韩成人高清视频| 国产日韩av高清| 久久久久久久欧美精品| 在线一区二区日韩| 中国老头性行为xxxx| 成人免费直播live| av片在线免费| 欧美三级在线看| 乱h高h女3p含苞待放| 日韩电影免费在线观看中文字幕 | 青草av.久久免费一区| 女同激情久久av久久| 欧美三级日韩三级| 国产在线免费视频| 欧美精品少妇videofree| 在线能看的av网站| 深夜成人在线观看| 久久91精品国产91久久小草| 国产在线视频欧美一区二区三区| 国产一区999| 日韩av高清在线播放| 成人综合婷婷国产精品久久蜜臀| 在线视频一区观看| 国产精品高潮呻吟| 久色乳综合思思在线视频| 成人免费毛片东京热| 国产香蕉97碰碰久久人人| 国产精品丝袜一区二区| 亚洲片国产一区一级在线观看| 天堂网中文在线观看| 韩国精品久久久999| 深夜福利影院在线观看| 成人天堂噜噜噜| 中文字幕在线免费不卡| 国产欧美视频一区| 欧美日韩国产成人在线观看| 天堂中文视频在线| 久久天天做天天爱综合色| aaaa黄色片| 精品一区二区国产| 国内精品伊人久久久久av影院 | 久久精品久久精品| 亚洲国产精品美女| 一二三四在线观看视频| 精品国产伦一区二区三区免费| 男女男精品网站| 亚洲一区二区在线看| 亚洲国产中文字幕久久网| 国产熟女一区二区丰满| 国产综合色一区二区三区| 久久综合色综合88| 中文字幕avav| 日韩欧美中文在线| 亚洲自拍偷拍精品| 亚洲国产欧美一区| 草久久免费视频| 国产自摸综合网| 欧美高清视频在线高清观看mv色露露十八 | 亚洲成人在线观看视频| 国产精品沙发午睡系列| 中文字幕久久亚洲| 一区二区在线观看免费| 国产一区二区三区在线观看免费视频 | 精品人妻伦九区久久aaa片| 91成人国产在线观看| 91丨九色丨丰满| 国产成人免费高清视频| 在线精品视频视频中文字幕| 亚洲成人av网址| 国内精品视频免费| 在线视频一区二区三| 麻豆成人久久精品二区三区小说| www.日本高清视频| 精品剧情在线观看| 少妇高潮一区二区三区99小说| 丁香啪啪综合成人亚洲| 国产91综合一区在线观看| 伊人免费视频二| 精品国产三级a在线观看| 久久国产精品露脸对白| 国产精品传媒在线观看| 久久久久久久香蕉| 日韩成人在线电影网| 色综合婷婷久久| 一级做a爱片久久毛片| 中文字幕第24页| 精品亚洲第一| 日韩免费一区二区三区在线播放| jizz中国少妇| 亚洲一区二区图片| 成人亚洲激情网| 欧美群妇大交群中文字幕| 欧美日韩一区二区三区69堂| 伊是香蕉大人久久| 欧美激情综合在线| 污污网站在线免费观看| 久久久.www| 久久精品国产精品| 日韩精品久久理论片| gogogo免费高清日本写真| 亚洲黄色尤物视频| 国产高潮久久久| 亚洲国产精品毛片av不卡在线| 国产精品久久久久7777婷婷| 中文字幕一区三区| 日韩电影在线观看电影| 亚洲无码精品一区二区三区| 精品无码人妻少妇久久久久久| 九九九九九九精品| 久久久电影一区二区三区| 亚洲www在线观看| 91一区二区在线| 韩国三级hd中文字幕有哪些| 国产精品伦子伦免费视频| 国产综合无码一区二区色蜜蜜| 色一情一乱一伦一区二区三区日本 | 人妻互换一区二区激情偷拍| 欧美日韩日本网| 偷窥少妇高潮呻吟av久久免费| 97在线观看免费视频| 欧洲一区二区日韩在线视频观看免费 | 91久久久一线二线三线品牌| 国产精品二区一区二区aⅴ污介绍| 国产一区视频导航| 国精产品乱码一区一区三区四区| 国产特黄一级片| 真实新婚偷拍xxxxx| 国产67194| 性欧美18—19sex性高清| 亚欧美在线观看| 欧美精品免费观看二区| 8090成年在线看片午夜| 欧美少妇性性性| 久久久综合视频| 亚洲av无码国产精品久久不卡| 亚洲码无人客一区二区三区| 91九色视频在线| 欧美日韩亚洲另类| 成人午夜私人影院| 青青草成人av| 永久av免费网站| 在线 丝袜 欧美 日韩 制服| 91精品国产三级| 视频一区二区三区在线观看 | 国产深夜男女无套内射| 高清免费日韩| 色香色香欲天天天影视综合网| 99精品黄色片免费大全| www.日韩高清| 欧美一级小视频| 国产成人在线综合| 影音先锋资源av| 成人信息集中地| 久久久99精品| 97人人澡人人爽人人模亚洲| 1024手机在线视频| a在线视频播放观看免费观看| 日韩人妻一区二区三区| 麻豆av免费在线| 亚洲一卡二卡三卡| 久久久噜噜噜久久| 欧美成人午夜激情在线| 欧美一区二区在线播放| 人妻少妇一区二区三区| 人妻有码中文字幕| 久久久久久国产三级电影| 亚洲三级久久久| www激情久久| 国产精品视频第一页| 亚洲天堂中文在线| 国产大片中文字幕| 中文字幕第24页| av中文字幕免费观看| 日本精品免费在线观看| 韩剧1988免费观看全集| 久久久成人精品视频| 亚洲精品中文字幕有码专区| 国产 欧美在线| 久久99精品久久久久久国产越南 | 亚洲无码精品在线观看| 国产农村妇女aaaaa视频| 国产黄色特级片| 亚洲天堂av免费在线观看| 亚洲福利av| 性欧美.com| 国产伦精品一区二区三毛| 国产欧美日韩中文字幕| 精品无人区乱码1区2区3区在线| 一区二区三区在线视频播放| 成人av电影免费在线播放| 日本一级淫片免费放| 国产aⅴ爽av久久久久成人| 天堂成人在线观看| 亚洲av成人无码久久精品老人 | 狠狠v欧美v日韩v亚洲ⅴ| 午夜精品久久久久久久96蜜桃| 国产精品热久久| 天天操天天干天天爽| 国产一区二区不卡老阿姨| 一区二区三区四区不卡在线| 亚洲а∨天堂久久精品9966| 一本色道久久88综合亚洲精品ⅰ| 久久69精品久久久久久久电影好 | 国产精品久久久久久无人区| 国产成人免费观看视频| 久久久久久久久久一区二区三区| 亚洲欧洲久久| http;//www.99re视频| 91久久精品久久国产性色也91| 国产精品 欧美在线| av噜噜色噜噜久久| 国产一二三在线视频| 一本久道久久综合| 国产欧美综合精品一区二区| 日本不卡二区| www.99热这里只有精品| 亚洲一级片网站| 能看的毛片网站| 亚洲一区二区三区精品视频| 一区中文字幕在线观看| 国产97在线 | 亚洲| 欧美激情 国产精品| 国产精品久久AV无码| 久久人人爽人人爽人人片av免费| 国精品**一区二区三区在线蜜桃| 亚洲综合在线第一页| 在线视频欧美日韩| 99视频在线播放| 国产亚洲欧美在线视频| 99精品欧美一区二区| 中文字幕一区二区三区波野结| 久久99精品久久只有精品| 99久久er热在这里只有精品66| 一区二区三区久久| 欧美一级一区二区| 欧美日韩在线观看一区二区 | 亚洲高清久久网| 日韩在线观看免费网站| 欧美激情视频网| 91免费精品国偷自产在线| 99在线免费视频观看| 日本xxx在线播放| 91影院在线播放| 超碰在线播放97| 麻豆久久久久久| 国产精品福利一区| 欧美日韩激情在线| 久99九色视频在线观看| 久久久99爱| 99电影在线观看| 精品国产电影| 少妇av一区二区三区无码| 国产精品久久免费观看| 国产精品免费无遮挡| 国产精品免费视频网站| 欧美极品另类videosde| 亚洲天堂男人的天堂| 国产精品成人一区二区三区| 日本一二区免费| 艳妇乳肉豪妇荡乳av无码福利| 成人午夜在线视频| 亚洲精品720p| 91精品啪aⅴ在线观看国产| 一区二区日本伦理|