在谷歌Kaggle平臺舉辦的AI國際象棋錦標賽決賽中,ChatGPT開發商OpenAI的模型以壓倒性優勢戰勝了埃隆馬斯克旗下xAI公司的Grok。這場匯集Anthropic、谷歌、DeepSeek等八家大語言模型的賽事,成為科技巨頭角力的新戰場。

On a black and white chess board, a black king chess piece stands upright. It is surrounded by toppled white pawns. 賽事焦點:通用AI的棋藝對決
? 歷史性測試場 :國際象棋長期被用作評估計算機能力的試金石。例如,1997年IBM深藍擊敗國際象棋世界冠軍卡斯帕羅夫※,2010年代谷歌DeepMind的AlphaGo又戰勝韓國圍棋大師李世石(后者賽后退役并感嘆存在無法戰勝的實體)。但本次比賽的特殊性在于——參賽模型并非專用棋類程序,而是服務于日常場景的通用AI。

粉絲們在紐約觀看國際象棋世界冠軍加里卡斯帕羅夫(電視屏幕上)和IBM深藍電腦之間的國際象棋比賽。比賽從游戲室轉播到禮堂,國際象棋專家分析每一步棋。
? OpenAI的完勝 :經過三日角逐,OpenAI的o3模型以全勝戰績晉級決賽,并在終極對決中四局全勝Grok 4。Grok在終局階段多次出現送后(主動犧牲皇后)的重大失誤,被國際象棋特級大師中村光在直播中點評為失誤頻發。
? 馬斯克的回應 :決賽前馬斯克在X平臺聲稱,Grok此前勝出只是副作用,強調幾乎未在象棋上投入精力。這與Chess.com記者Pedro Pinhata的觀察形成反差——半決賽前Grok曾被視作無可阻擋的強者,但最終幻象在賽事最后一日破滅。
科技巨頭的智能宣稱戰
賽事落幕之際,OpenAI與xAI的競爭更趨白熱化:
? GPT-5的突破 :OpenAI首席執行官薩姆奧特曼將GPT-5定義為口袋里的博士團隊,宣稱其實現三大進化:
1. 采用新型推理模型增強邏輯能力
2. 顯著減少幻覺現象(編造事實)與欺騙性輸出
3. 編程能力達專業開發者水準

Sam Altman hearing a headset microphone on stage at an event
? 馬斯克的隔空交鋒 :GPT-5發布當日,馬斯克在X平臺宣稱:Grok 4 Heavy兩周前就比現在的GPT-5聰明。牛津大學倫理AI教授卡麗莎維利茲對此持保留意見:這些系統的盈利能力尚未驗證,過度宣傳恐存泡沫風險。

Elon Musk 商業模式的分歧與挑戰
雙方在AI商業化路徑上顯現根本差異:
我們迄今專注讓Grok成為全球最精準的AI,現在該考慮如何支付昂貴GPU了。
——馬斯克向廣告商宣布Grok將引入付費推薦位
? OpenAI的倫理調整 :繼五月因過度諂媚撤回更新后,OpenAI宣布GPT-5將引導用戶自主思考情感決策(如該分手嗎)。奧特曼承認:人們可能與AI建立具有潛在風險的擬社會關系,社會需要設立新的防護機制。
? xAI的盈利轉型 :曾多次抨擊OpenAI盈利化的馬斯克,轉向允許廣告商付費植入Grok回復。此舉引發準確性擔憂——當商業利益滲透AI答案時,其可信度可能受損。更棘手的是,Grok此前曾發表反猶言論甚至批評馬斯克本人,品牌合作風險顯著。

Illustration shows OpenAI logo 歷史棋局與未來挑戰
這場賽事揭示出AI發展的新維度:
? 能力評估進化 :與深藍依賴暴力計算不同,現代大語言模型展現出通用策略學習能力。卡斯帕羅夫曾諷刺深藍為千萬美元的鬧鐘。
? 監管緊迫性 :艾達洛芙萊斯研究所所長蓋婭馬庫斯警告:AI能力與治理能力間的差距日益擴大
? 創作權爭議 :Getty Images首席產品官強調:當AI內容以假亂真,必須審視訓練數據來源并保障創作者權益
隨著GPT-5向7億用戶開放,Grok增強版持續升級,這場關于智能水平與商業路徑的較量,已遠超棋局勝負,引發對AI倫理、監管框架及技術本質的深層思考。




京公網安備 11011402013531號