當(dāng)前位置：首頁 ? 資訊 ? 新科技 ? 正文

阿里開源下一代模型架構(gòu)Qwen3-Next，模型訓(xùn)練及推理性價(jià)比創(chuàng)新高

IP屬地中國·北京 編輯：朱天宇雷峰網(wǎng) 時(shí)間：2025-09-12 12:24:15

9月12日，阿里通義發(fā)布下一代基礎(chǔ)模型架構(gòu)Qwen3-Next。Qwen3-Next針對大模型在上下文長度和總參數(shù)兩方面不斷擴(kuò)展（Scaling）的未來趨勢而設(shè)計(jì)，采用全新的高稀疏MoE架構(gòu)，并對經(jīng)典Transformer核心組件進(jìn)行了重構(gòu)，創(chuàng)新線性注意力和自研的門控注意力結(jié)合的混合注意力機(jī)制，實(shí)現(xiàn)了模型訓(xùn)練和推理的雙重性價(jià)比突破。
基于這一新架構(gòu)，阿里通義“打樣”了Qwen3-Next-80B-A3B系列模型，開源指令（Instruct）和推理（Thinking）兩大模型版本。新模型總參數(shù) 80B 僅激活 3B，性能可媲美千問3旗艦版235B模型，模型計(jì)算效率大幅提升。Qwen3-Next訓(xùn)練成本較密集模型Qwen3-32B大降超90%，長文本推理吞吐量提升10倍以上，并可支持百萬Tokens超長上下文。

免責(zé)聲明：本網(wǎng)信息來自于互聯(lián)網(wǎng)，目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點(diǎn)。其內(nèi)容真實(shí)性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益，請及時(shí)聯(lián)系我們，本站將會(huì)在24小時(shí)內(nèi)處理完畢。

同類資訊

羅永浩錘子軟件在上海成立分公司

豆包視頻生成大升級(jí)，網(wǎng)友們的腦洞終于自帶音效了

字節(jié)跳動(dòng)被傳全年利潤500億美元?jiǎng)?chuàng)新高知情人士回應(yīng)：數(shù)據(jù)不實(shí) 偏差較大

大疆的“印鈔機(jī)”，被手機(jī)廠商盯上了

特斯拉專利給攝像頭裝“電動(dòng)墨鏡”提升自動(dòng)駕駛可靠性

獨(dú)家丨山姆系高管入職京東數(shù)月「閃退」，其負(fù)責(zé)的自有品牌事業(yè)部接連調(diào)整

全站最新

羅永浩錘子軟件在上海成立分公司

豆包視頻生成大升級(jí)，網(wǎng)友們的腦洞終于自帶音效了

字節(jié)跳動(dòng)被傳全年利潤500億美元?jiǎng)?chuàng)新高知情人士回應(yīng)：數(shù)據(jù)不實(shí) 偏差較大

大疆的“印鈔機(jī)”，被手機(jī)廠商盯上了

熱門推薦

羅永浩錘子軟件在上海成立分公司

豆包視頻生成大升級(jí)，網(wǎng)友們的腦洞終于自帶音效了

字節(jié)跳動(dòng)被傳全年利潤500億美元?jiǎng)?chuàng)新高知情人士回應(yīng)：數(shù)據(jù)不實(shí) 偏差較大

大疆的“印鈔機(jī)”，被手機(jī)廠商盯上了

特斯拉專利給攝像頭裝“電動(dòng)墨鏡”提升自動(dòng)駕駛可靠性

獨(dú)家丨山姆系高管入職京東數(shù)月「閃退」，其負(fù)責(zé)的自有品牌事業(yè)部接連調(diào)整

笑瘋了！AI開小賣部被人類騙到破產(chǎn)，PS5竟然0元送

「一腦多形」圓桌：世界模型、空間智能在具身智能出現(xiàn)了哪些具體進(jìn)展？丨GAIR 2025

奧動(dòng)新能源港股IPO：“報(bào)表優(yōu)化”后的盈利迷霧

Karpathy2025年AI終極復(fù)盤：我們還沒發(fā)揮出LLM潛力的10%

百人會(huì)張永偉：2026年車市2%微增長，行業(yè)出清將加速

為船舶配備“AI 護(hù)航員” 我國首套全國產(chǎn)化VTS系統(tǒng)落地大連

說句話就能改文檔！微軟Copilot新增語音實(shí)時(shí)編輯功能

保時(shí)捷718純電版被拍到開啟第四輪冬測，研發(fā)周期破紀(jì)錄

維基百科聯(lián)合創(chuàng)始人：馬斯克的Grokipedia受到批評，我并不感到驚訝