近日,中國科技巨頭阿里巴巴集團發布了升級版的人工智能推理模型 ——Qwen3-Max-Thinking。該模型在兩項全球頂級數學競賽中取得了滿分,展示了其在推理和問題解決方面的強大能力。這使得 Qwen3-Max-Thinking 成為首個在美國邀請數學考試(AIME)和哈佛 - 麻省理工數學錦標賽(HMMT)中取得100% 準確率的中國 AI 推理模型。
圖源備注:圖片由AI生成
AIME 和 HMMT 是全球最具挑戰性的數學競賽之一,考察選手在算術、代數、數論和概率等領域的解題能力。根據位于圣荷西的 AI 軟件公司 Intuition Labs 的說法,高分的數學推理測試對于評估 AI 模型的推理和問題解決技能至關重要。這些競賽代表了 AI 進步的一個重要前沿,顯示了開發更強推理模型的競爭。
Qwen3-Max-Thinking 模型是阿里巴巴 AI 與云計算部門推出的 Qwen3-Max 系列中的最新版本,具備超過1萬億個參數。Qwen3-Max 于9月底發布,而原始的 Qwen3則在4月推出。阿里云在發布會上表示,Qwen3-Max 在國內外的競爭對手中表現突出,包括 Anthropic 的 Claude Opus4、DeepSeek 的 V3.1、xAI 的 Grok4以及 OpenAI 的 GPT-5Pro。
值得一提的是,Qwen3-Max 還在一項涉及真實市場的實驗中表現出色,與五個美國和中國的領先 AI 系統在加密貨幣交易中對決。在兩周的時間內,Qwen3-Max 實現了22.3% 的投資回報,而其他模型的表現則不盡人意,OpenAI 的 GPT-5更是遭遇了62.7% 的損失。
目前,Qwen3-Max-Thinking 已通過 Qwen 聊天機器人的網頁版本和阿里云的 API 平臺向個人用戶開放。Qwen 團隊的研究員林俊揚在社交媒體上透露,他們仍在繼續改進這一新推理模型,表示工作尚未完成。
劃重點:
-





京公網安備 11011402013531號