![]()
新智元報道
編輯:KingHZ 桃子
第二輪首屆大模型對抗賽結果出爐了!o3輕而易舉擊敗o4-mini,拿下100%勝率。Grok 4和Gemini 2.5 Pro激烈對決,最終在加賽中Grok 4成功晉級。明日,Grok 4和o3將迎來終局之戰。
首屆大模型國際象棋對抗賽,第二輪戰報出爐了!
Kaggle Game Arena上,谷歌舉辦的AI國際象棋表演賽中,Grok 4和o3順利挺進半決賽:
o3一舉擊敗o4-mini
Grok 4在加賽中戰勝Gemini 2.5 Pro,晉級決賽將迎戰o3
![]()
十幾個小時的激烈對決中,全球八大頂尖模型,如今僅剩下Grok 4和o3順利挺進半決賽。
在首輪對戰中,DeepSeek R1、Kimi K2 Instruct、Claude Opus 4、Gemini 2.5 Flash全部潰敗。
![]()
Kaggle Game Arena 2025 AI國際象棋表演賽:半決賽對陣圖
如今,第二輪的結果,再次篩選出了兩位優勝者。
盡管o3的勝出早有預料,Grok與Gemini之間的對決卻異常激烈,常規賽戰成2比2后,最終通過加賽才分出勝負。
![]()
賽事的最后一日將在8月7日(星期四)舉行,開賽時間為美國東部時間下午1點(ET)。
屆時,國際象棋世界冠軍Magnus Carlsen與英國三連冠棋手David Howell攜手解說Grok 4對陣o3的巔峰對決。
![]()
傳送門:https://www.kaggle.com/game-arena
若是o3拿下最終冠軍,再加上萬眾矚目的GPT-5登場,OpenAI明天可謂是雙喜臨門。
那么,第二輪大模型對戰,具體情況如何?
o3穩贏o4-mini,準確率100%
根據OpenAI的介紹,o4-mini是o3的輕量化、運行更快的版本。
因此,o3以4比0橫掃對手晉級決賽,也在情理之中。
雖然這場比賽的初衷是研究AI的「思考」方式,但第二盤棋卻令不少普通棋迷眼前一亮:
o3在僅用12步的快棋中實現了一次類似Puzzle Rush的將殺,雖不是真正意義上的密殺(smothered mate),但完成度非常接近。

雖然AI在本賽事中的棋藝屢遭詬病,但o3在這盤棋中卻打出了100分的完美準確率:
![]()
o3 vs. o4-mini,準確率100分
本輪后續的比賽節奏也基本如出一轍:較弱的AI(此處為o4-mini)在中盤階段失去判斷力,連續犯下關鍵失誤。
不過值得一提的是第三盤,這可能是目前為止最自然、最接近人類風格的一局。
尤其是o3在棋局中完成的兩個中間手(intermezzo)——12...Bb4+和19...e3+,堪稱本輪亮點。
![]()
o3晉級決賽,將與另一場激戰的勝者會師。
Grok 4險些折戟,鏖戰Gemini 2.5 Pro
盡管Grok在賽事中的表現一直相當強勢,這次卻險些折戟。
最終,在加賽「末日戰」(Armageddon)中,Grok 4用黑棋在占優局面下逼和對手,才得以晉級。
![]()
比賽伊始,Grok的表現出人意料地混亂,在短時間內連續失子,被Gemini抓住機會贏下首局。
第二盤,雙方在第11步前一直遵循開局理論。
通常情況下,AI只要跟隨開局理論就表現不錯,一旦進入「自由發揮」階段,就容易出錯。
而Grok和Gemini的開局掌握明顯強于其他模型,也讓這場對決異常焦灼。
不過,Grok一旦脫離理論,很快就開始出錯——先是丟馬,但Gemini也隨即「走火入魔」,不但送出皇后,最后整盤棋也丟掉,Grok扳回一局。

接下來兩盤棋依然各有勝負,走的都是熟悉劇本:AI在短暫的「理論時間」后很快開始失誤。
Grok贏下第三局暫時領先,Gemini在第四局扳平比分。
比賽進入加賽環節,采用「末日戰」規則,Grok執黑,具有和棋即勝優勢(雖然此次并無時間限制)。
加賽過程跌宕起伏。
![]()
Gemini曾長時間占優,甚至錯過了一步直接將死的機會——與o3擊敗o4-mini的那步棋型如出一轍。
國際象棋大師Peter Heine Nielsen(世界冠軍Magnus Carlsen的教練)也順勢對Grok給出了「指導建議」。
![]()
最終,Gemini在多子殘局中送掉皇后,看似已將勝利拱手相讓。
但Grok沒能把握優勢,在多一車的局勢下未能完成絕殺,因三次重復局面被判和棋,比賽最終以平局告終。
盡管結局略顯遺憾,但這局仍被評為「今日最佳對局」。
第二輪比賽戰況就這么多,想必所有人都期待明日終局之戰——Grok與o3將于明天爭奪冠軍。
Gemini 2.5 Pro和o4-mini則將進行三四名對決。記得鎖定總決賽直播!
參考資料:
https://x.com/kaggle/status/1953200228842020926
https://www.youtube.com/watch?v=-m33dn_3sNQ
https://www.chess.com/news/view/kaggle-game-arena-chess-2025-day-2
![]()





京公網安備 11011402013531號