阿里開源新架構(gòu)Qwen3-Next，模型訓(xùn)練成本降9成，長文本推理吞吐提升10倍

IP屬地中國·北京 編輯：陸辰風每日經(jīng)濟新聞 時間：2025-09-12 12:19:42

每經(jīng)杭州9月12日電（記者葉曉丹）9月12日，阿里通義發(fā)布下一代基礎(chǔ)模型架構(gòu)Qwen3-Next。Qwen3-Next針對大模型在上下文長度和總參數(shù)兩方面不斷擴展（Scaling）的未來趨勢而設(shè)計，采用全新的高稀疏MoE架構(gòu)，并對經(jīng)典Transformer核心組件進行了重構(gòu)，創(chuàng)新采用線性注意力和自研門控注意力結(jié)合的混合注意力機制，實現(xiàn)了模型訓(xùn)練和推理的雙重性價比突破。
基于這一新架構(gòu)，阿里通義“打樣”了Qwen3-Next-80B-A3B系列模型，開源指令（Instruct）和推理（Thinking）兩大模型版本。新模型總參數(shù)80B僅激活3B，性能可媲美千問3旗艦版235B模型，模型計算效率大幅提升。Qwen3-Next訓(xùn)練成本較密集模型Qwen3-32B大降超90%，長文本推理吞吐量提升10倍以上，并可支持百萬Tokens（文本處理的最小單位?）超長上下文。

免責聲明：本網(wǎng)信息來自于互聯(lián)網(wǎng)，目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點。其內(nèi)容真實性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系我們，本站將會在24小時內(nèi)處理完畢。

同類資訊

羅永浩「科技春晚」將放票：門票收益將用于公益

炮制謠言、非法薦股、散播虛假信息，這些自媒體賬號被處置

水獺、樹和鳥，于自然間重寫自我

豆包視頻生成大升級，網(wǎng)友們的腦洞終于自帶音效了。

不玩“虛”的！硬核兌現(xiàn)！上海元宇宙交出3年實戰(zhàn)答卷→

阿里千問緊急辟謠

全站最新

羅永浩「科技春晚」將放票：門票收益將用于公益

炮制謠言、非法薦股、散播虛假信息，這些自媒體賬號被處置

水獺、樹和鳥，于自然間重寫自我

豆包視頻生成大升級，網(wǎng)友們的腦洞終于自帶音效了。

熱門推薦

羅永浩「科技春晚」將放票：門票收益將用于公益

炮制謠言、非法薦股、散播虛假信息，這些自媒體賬號被處置

水獺、樹和鳥，于自然間重寫自我

豆包視頻生成大升級，網(wǎng)友們的腦洞終于自帶音效了。

阿里辟謠

不玩“虛”的！硬核兌現(xiàn)！上海元宇宙交出3年實戰(zhàn)答卷→

今年創(chuàng)紀錄！字節(jié)跳動利潤據(jù)稱有望達500億美元

谷歌云深化與Palo Alto Networks合作，簽署近100億美元AI安全大單

羅永浩投訴上海電信千兆寬帶網(wǎng)速慢！公司稱有多種原因可維修

阿里千問緊急辟謠

力積存儲再度遞表沖擊港股IPO：近年累虧超5億元，利基DRAM布局下仍面臨多重挑戰(zhàn)

一加中國區(qū)總裁李杰：Turbo系列擁有“超巨量的電池”

華為云零售峰會2025：Data+AI雙引擎實效落地，共筑智能時代新零售

安卓上線“擴展深色主題”設(shè)置，專治堅守淺色UI的“不聽話”App

國產(chǎn)GPU四小龍IPO齊活！最后一個剛剛公布