作者 | 香草
編輯 | 李水青
9月13日報道,今日凌晨,OpenAI突然發布傳說中“草莓”模型的部分預覽版——OpenAI o1預覽版。這是一系列全新AI模型,能推理復雜的任務,解決比以前科學、編程、數學模型更難的問題。

▲OpenAI發布o1模型
OpenAI o1是全新系列AI模型的第一款。與以往模型不同的是,它擁有進化的推理能力,會在回答前進行縝密思考,生成一個長長的內部思維鏈,在競爭性編程問題上排名第89位,在美國數學奧林匹克預選資格賽中排名前500,在物理、生物、化學問題的基準測試中準確度超過了人類博士水平!
新發布的另一款o1 mini是一款更快、更小的模型,使用與o1類似的框架進行訓練。o1 mini擅長理工學科,尤其是數學和編程,其成本比o1預覽版便宜80%。
這兩款模型被OpenAI視為復雜推理任務的重大進步,因此被命名為o1,重置計數器,而非作為GPT系列的延續。
不過,推理增強版的o1模型,還是在9.9和9.11比大小這種“高階問題”上慘敗。
▲o1模型回答“比大小”問題
已經離開OpenAI創業的OpenAI創始成員、前特斯拉AI高級總監Andrej Karpathy今早發文吐槽:“o1-mini一直拒絕為我解決黎曼假設。模型懶惰仍然是一個主要的問題




京公網安備 11011402013531號