在人工智能領域,一個令人矚目的消息悄然傳出:OpenAI的一個小型團隊僅憑三人之力,竟成功打造出一個在國際數學奧林匹克競賽(IMO)中奪得金牌的模型。這一驚人成就的背后故事,在一次媒體訪談中逐漸浮出水面。
項目負責人Alexander Wei、新加入的研究工程師Sheryl Hsu以及高級研究科學家Noam Brown,構成了這個創造歷史的核心團隊。盡管Sheryl Hsu今年三月才加入團隊,但他們的共同努力使得項目在短時間內取得了突破性進展。
據透露,該項目從構思到成型,僅僅用了兩三個月的時間,其成果之顯著,出乎所有人的預料。大型語言模型在IMO中摘金,不僅標志著AI數學能力的飛躍,更展現了其在應對復雜、難以驗證任務時的技術進步。
訪談中,團隊分享了項目的諸多細節。早在2021年,OpenAI內部就已開始討論贏得IMO金牌的可能性,盡管相關算法和思路的醞釀已持續數月,但真正的集中攻關只在競賽前的兩三個月內展開。
核心團隊的三人組合,由Alex主導技術開發。起初,他的新技術方案遭遇了質疑,但隨著他在處理難以驗證任務上展現出顯著成效,方案逐漸獲得了團隊和公司的支持。Alex、Cheryl和Noam,他們共同書寫了這段傳奇。
關于AI生成的數學證明,團隊坦言其風格獨特,甚至可以被形容為“糟糕”或“富有創意”。這些證明充滿了機器的邏輯,對人類而言晦澀難懂。然而,為了保持透明度,OpenAI并未對這些證明進行可讀性優化,而是將它們原封不動地發布在GitHub上,供全球學者查閱。
在IMO競賽中,模型面對傳統上最為困難的第三題和第六題時,選擇了對第六題“不作答”。團隊并未將此舉視為失敗,反而認為它顯示了模型對自身能力邊界的清晰認知。在無法解決問題時,模型選擇了放棄,而非像過去的AI那樣編造錯誤答案,這一轉變被視為積極的信號。
當被問及AI是否能在短期內解決“千禧年大獎難題”時,Alex表示這些難題仍遙不可及。他用量化對比來闡述差距:AI從解決簡單的小學數學題,躍升至攻克IMO難題,但研究級數學難題的突破,可能需要天才數學家花費數千小時。因此,盡管團隊對取得的進展感到興奮,但也對未來挑戰保持謙卑。
Noam指出,當模型“思考”時間極長時,評估本身成為巨大瓶頸。目前,團隊正面臨如何有效評估長時間思考的模型的挑戰。同時,multi-agents系統在項目中扮演了重要角色,盡管具體技術細節不便透露,但團隊強調了通用技術在項目中的應用。
對于為何不使用Lean這種形式化證明工具,團隊解釋說,他們的首要任務是發展通用的推理能力。雖然Lean對數學家有價值,但其局限性在于只能處理嚴格形式化的問題,而現實世界中的問題遠不止于此。因此,團隊選擇了自然語言推理作為優先發展方向。
Cheryl證實,該項目是在與其他OpenAI產品相似的基礎設施上構建的,這再次印證了其方法的通用性。團隊期望這些技術能夠被應用于推理的其他領域,從而持續改進包括ChatGPT在內的所有模型。
訪談最后,團隊表示,讓模型學會提出新穎的、有價值的問題,是繼解決問題之后AI需要克服的下一個巨大障礙。同時,他們也期待數學家們能利用這個強大的新工具來挑戰更多難題。





京公網安備 11011402013531號