
鳳凰網科技訊 7月10日,馬斯克旗下人工智能公司xAI正式發布其最新一代大語言模型Grok 4,并同步推出多智能體協作版本Grok 4 Heavy。Grok 4定位為“全球最強大的人工智能模型”。馬斯克宣稱,Grok 4的智能水平已經“全面超越博士智力”,尤其在學術問題上,它能在所有學科中達到甚至超越博士級別。馬斯克更樂觀預計,Grok 4有望在今年內為人類帶來“發現新技術”的突破,并可能在明年發現新的物理現象。
xAI介紹,Grok 4在訓練計算量上實現了顯著飛躍,與Grok 2相比,其訓練量增加了100倍。特別是在推理和強化學習(RL)方面,Grok 4投入了大量計算資源,其RL計算量是其他任何模型的10倍以上。這得益于xAI構建的擁有10萬塊H100 GPU的“世界超級計算機”。Grok 2在12個月前還只是一個概念,而如今的標準下,Grok 2的模型智能水平已相當于高中生。
在多項嚴苛的基準測試中,Grok 4展現出強大實力。在被稱為“人類最終考試”的HLI(Humanities Last Exam)基準中,該模型在未使用工具的情況下解決了25%的問題。而其多智能體版本Grok 4 Heavy,通過并行協作,進一步將文本子集問題的解決率提升至超過50%。此外,Grok 4還在包括PhD級別問題集在內的所有推理基準測試中表現出色,甚至在編碼基準和數學競賽中取得了滿分,通常比第二名模型有顯著領先。
Grok 4的強大能力已在多個實際場景中得到驗證。在模擬商業環境的“自動售貨機基準測試”中,Grok 4表現最佳,其創造的凈資產是第二名模型的兩倍,并能長期堅持其策略。它還能協助生物醫學研究,幫助科學家篩選數百萬實驗日志,快速提出最佳假設,并已應用于CRISPR研究。在游戲開發領域,Grok 4展示了4小時內生成第一人稱射擊游戲的能力,通過自動化資產采購,大幅提升了開發效率。它甚至能基于X平臺數據分析并預測世界杯賠率、查找特定內容或生成復雜的時間線,并能生成大致正確的雙黑洞碰撞可視化。
目前,Grok 4及其多智能體版本Grok 4 Heavy已通過訂閱服務開放使用。開發者也可通過API接口訪問,其上下文長度高達256K。xAI同時公布了Grok語音模式的顯著提升,端到端延遲降低一半,并引入了多款更自然、富有情感的新聲音,例如具有史詩般低沉聲線的Sal和能表達豐富情感的英倫女聲Eve。
盡管Grok 4在多模態理解(特別是圖像理解和生成)方面仍存在“部分盲點”,但xAI表示,其基礎模型的第七個版本(計劃在幾周內完成訓練)將解決這一弱點,未來模型將能夠像人類一樣“聽到和看到世界”。xAI正加速推進視頻生成模型的訓練,預計今年將出現首部可觀看的AI生成電視節目片段,明年有望出現首部AI電影。
公司強調,未來將專注于開發既“快速又智能”的模型,尤其是在編程領域。xAI認為,人類正處于一個“巨大的智能爆發的開端”,并預期AI將驅動經濟規模達到當前數千甚至數百萬倍。同時,xAI也強調AI安全的重要性,認為AI最重要的是要“最大限度地追求真相”,如同培養一個有正確價值觀的“超級天才兒童”。
未來,xAI設想Grok與特斯拉Optimus類人形機器人結合,通過與現實世界的互動,將能更深層次地驗證假設,推動AI能力的最終飛躍。





京公網安備 11011402013531號