7月31日,通義千問團(tuán)隊(duì)在公眾平臺(tái)發(fā)布消息,Qwen3-30B實(shí)現(xiàn)重大升級(jí),全新推理模型Qwen3-30B-A3B-Thinking-2507正式發(fā)布。新模型拓展了思考能力,提升了推理的質(zhì)量和深度,是一個(gè)更睿智、更敏捷、更全能的新推理模型。

新模型在推理能力、通用能力及上下文長度上有了顯著提升,新模型在聚焦數(shù)學(xué)能力的AIME25評(píng)測中獲85.0分,在代碼能力測試LiveCodeBench v6中得分66.0,兩項(xiàng)核心推理能力均超越Gemini2.5-Flash(thinking)、Qwen3-235B-A22B(thinking);新模型的知識(shí)水平(GPQA、MMLU-Pro)也較上一版本進(jìn)步顯著;在寫作(WritingBench)、Agent能力(BFCL-v3)、多輪對話和多語言指令遵循(MultiIF)等通用能力評(píng)測中,Qwen3-30B-A3B-Thinking-2507均超越Gemini2.5-Flash(thinking)、Qwen3-235B-A22B(thinking);原生支持256K tokens,可擴(kuò)展至1M tokens。

值得一提的是,新模型的思考長度增加,團(tuán)隊(duì)建議在處理高度復(fù)雜的推理任務(wù)時(shí),設(shè)置更長的思考預(yù)算,可以充分發(fā)揮新模型潛力。
目前Qwen3-30B-A3B-Thinking-2507已在魔搭社區(qū)、HuggingFace上開源,Qwen Chat同步上線。





京公網(wǎng)安備 11011402013531號(hào)