![]()
機器之心報道
編輯:張倩
繼前段時間密集發布了三款 AI 大模型后,Qwen 凌晨又更新了 —— 原本的 Qwen3-30B-A3B 有了一個新版本:Qwen3-30B-A3B-Instruct-2507
這個新版本是一個非思考模式(non-thinking mode)的新模型。它的亮點在于,僅激活 30 億(3B)參數,就能展現出與業界頂尖閉源模型,如谷歌的 Gemini 2.5-Flash(非思考模式)和 OpenAI 的 GPT-4o 相媲美的超強實力,這標志著在模型效率和性能優化上的一次重大突破。
下圖展示了該模型的性能數據,可以看出,與更新前的版本相比,新版本在多項測試中都實現了跨越式提升,比如 AIME25 從之前的 21.6 提升到了 61.3,Arena-Hard v2 成績從 24.8 提升到了 69.0。
![]()
下圖展示了新版本和 DeepSeek-V3-0324 等模型的性能對比結果,可以看到,在很多基準測試中,新版本模型可以基本追平甚至超過 DeepSeek-V3-0324。
![]()
這讓人感嘆模型計算效率的提升速度。
![]()
具體來說,Qwen3-30B-A3B-Instruct-2507 在諸多方面實現了關鍵提升:
通用能力大幅提升,包括指令遵循、邏輯推理、文本理解、數學、科學、編程及工具使用等多方面;在多語言的長尾知識覆蓋方面,模型進步顯著在主觀和開放任務中,新模型與進一步緊密對齊了用戶偏好,可以生成更高質量的文本,為用戶提供更有幫助的回答;長文本理解能力提升至 256K
![]()
現在模型已經在魔搭社區和 HuggingFace 等平臺開源。QwenChat 上也可以直接體驗。
體驗鏈接:http://chat.qwen.ai/
該模型發布后也很快得到了社區的支持,有了更多的使用渠道,甚至還有了量化版本。這就是開源的力量。
![]()
![]()
它的出現,讓大家在消費級 GPU 上運行 AI 模型有了新的選擇。
![]()
有人曬出了這個新版本在自己的 Mac 電腦、搭載 RTX 3090 的 PC 等設備上的運行體驗。
![]()
![]()
![]()
如果你也想運行這個模型,可以參考這個配置要求:
![]()
值得注意的是,這次的新版本模型是一個非推理模型。著名開發者 Simon Willison 將該模型與他之前測試過的「推理」 模型(如 GLM-4.5 Air)進行了對比。他得出的核心結論是:對于生成「開箱即用」的復雜代碼這類任務,模型是否具備「推理」能力可能是一個至關重要的因素。
![]()
Qwen 團隊的這次更新依然在深夜進行,這讓其他同行再次感覺被卷到了。不過,每天醒來都能看到 AI 的能力又上了一個新臺階,這本身就是一件激動人心的事。
![]()





京公網安備 11011402013531號