?阿里Qwen3-Max-Thinking在全球數學競賽中拔得頭籌，挑戰 OpenAI 的領先地位

IP屬地中國·北京 編輯：沈瑾瑜 Chinaz 時間：2025-11-10 10:16:33

近日，中國科技巨頭阿里巴巴集團發布了升級版的人工智能推理模型 ——Qwen3-Max-Thinking。該模型在兩項全球頂級數學競賽中取得了滿分，展示了其在推理和問題解決方面的強大能力。這使得 Qwen3-Max-Thinking 成為首個在美國邀請數學考試（AIME）和哈佛 - 麻省理工數學錦標賽(HMMT)中取得100% 準確率的中國 AI 推理模型。
圖源備注：圖片由AI生成
AIME 和 HMMT 是全球最具挑戰性的數學競賽之一，考察選手在算術、代數、數論和概率等領域的解題能力。根據位于圣荷西的 AI 軟件公司 Intuition Labs 的說法，高分的數學推理測試對于評估 AI 模型的推理和問題解決技能至關重要。這些競賽代表了 AI 進步的一個重要前沿，顯示了開發更強推理模型的競爭。
Qwen3-Max-Thinking 模型是阿里巴巴 AI 與云計算部門推出的 Qwen3-Max 系列中的最新版本，具備超過1萬億個參數。Qwen3-Max 于9月底發布，而原始的 Qwen3則在4月推出。阿里云在發布會上表示，Qwen3-Max 在國內外的競爭對手中表現突出，包括 Anthropic 的 Claude Opus4、DeepSeek 的 V3.1、xAI 的 Grok4以及 OpenAI 的 GPT-5Pro。
值得一提的是，Qwen3-Max 還在一項涉及真實市場的實驗中表現出色，與五個美國和中國的領先 AI 系統在加密貨幣交易中對決。在兩周的時間內，Qwen3-Max 實現了22.3% 的投資回報，而其他模型的表現則不盡人意，OpenAI 的 GPT-5更是遭遇了62.7% 的損失。
目前，Qwen3-Max-Thinking 已通過 Qwen 聊天機器人的網頁版本和阿里云的 API 平臺向個人用戶開放。Qwen 團隊的研究員林俊揚在社交媒體上透露，他們仍在繼續改進這一新推理模型，表示工作尚未完成。
劃重點:
-

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

設立“虛擬公司”，上海布局合成生物顛覆性技術項目｜跟著項目經理看未來產業

越獄新曙光：iOS 26.2 Beta 1以下版本關鍵漏洞公開

AI巨頭擬500億美元入局AI基建

《汽車數據出境安全評估方法》團體標準發布

蘋果2026 iPad路線圖曝光：三款新品齊發，mini迎來史詩級升級

100%國產化！國產機器人靈巧手突破“卡脖子”壁壘

全站最新

設立“虛擬公司”，上海布局合成生物顛覆性技術項目｜跟著項目經理看未來產業

越獄新曙光：iOS 26.2 Beta 1以下版本關鍵漏洞公開

AI巨頭擬500億美元入局AI基建

《汽車數據出境安全評估方法》團體標準發布

熱門推薦

設立“虛擬公司”，上海布局合成生物顛覆性技術項目｜跟著項目經理看未來產業

越獄新曙光：iOS 26.2 Beta 1以下版本關鍵漏洞公開

AI巨頭擬500億美元入局AI基建

《汽車數據出境安全評估方法》團體標準發布

蘋果2026 iPad路線圖曝光：三款新品齊發，mini迎來史詩級升級

100%國產化！國產機器人靈巧手突破“卡脖子”壁壘

廣汽能源聯動支付寶推出“碰一下”支付，AI支持選址、動態定價

機降突擊！陸航多型直升機沖向目標地域

科學與健康｜月球也會“生銹”？嫦娥六號月背樣品中首次發現晶質赤鐵礦

馬斯克最新訪談：目標每年在太空部屬100吉瓦AI衛星

未來的iPhone，想靠衛星消滅無服務

2025中國國際石墨烯創新大會在溫州舉行多項關鍵技術取得突破

創新是走出低谷、完成突破的動力（親歷者說）

線下線上齊發力，渝貨出山有實招

觀察|全固態電池商業化時間表成爭議焦點，高成本或阻礙推廣