IT之家 12 月 5 日消息,科技媒體 NeoWin 今天(12 月 5 日)發布博文,報道稱谷歌面向 Gemini Ultra 訂閱(月費 249.99 美元)用戶,推出了 Gemini 3 Deep Think(深度思考)模式。
相比較標準版 Gemini 3 Pro 模型,Deep Think 模式調用了更多計算資源,并采用了全新技術架構。該功能目前已完全集成至 Gemini App 中,Google AI Ultra 訂閱用戶即日起可通過在提示欄中選擇“Deep Think”與 Gemini 3 Pro 模型搭配使用。
![]()
谷歌官方數據顯示,Deep Think 模式在處理復雜數學、科學及邏輯問題時的推理能力實現了顯著飛躍。IT之家援引博文介紹,在被譽為“業內最難 AI 基準測試之一”的 Humanity’s Last Exam 中,該模式取得了 41% 的高分,確立了新的行業標桿。
同時,在 GPQA Diamond 科學知識測試中,其得分高達 93.8%;在包含代碼執行的 ARC-AGI-2 嚴苛測試中,也拿下了 45.1% 的成績,均展現出業內頂尖(State-of-the-art)的性能水平。
![]()
Deep Think 模式之所以能取得如此突破,核心在于運用了先進的并行推理技術(Advanced Parallel Reasoning),讓模型能夠同時探索多種假設路徑以尋找最優解。
值得注意的是,該模型的變體此前已在國際數學奧林匹克競賽(IMO)和國際大學生程序設計競賽(ICPC)世界總決賽中達到了“金牌標準”。特別是在 IMO 場景下,模型需在無法訪問互聯網或工具的情況下,于兩個 4.5 小時的考試時段內完成解題并撰寫自然語言證明。
谷歌此次公測被視為對競爭對手的有力回擊。OpenAI 曾在今年 7 月聲稱其實驗性推理大模型達到了數學奧賽金牌水平,但截至目前該模型仍未向公眾開放。
隨著谷歌率先將達到 IMO 金牌標準的模型推向大眾市場,行業普遍預測,這一舉動或將迫使 OpenAI 加快同類產品的發布節奏,大模型領域的“推理能力之戰”將進一步升級。





京公網安備 11011402013531號