OpenAI草莓模型深夜突襲！理化生達博士生水平，比GPT-4o強多了，ChatGPT可用

IP屬地中國·北京 編輯：江紫萱智東西 時間：2024-09-13 09:34:18

作者 | 香草
編輯 | 李水青
9月13日報道，今日凌晨，OpenAI突然發布傳說中“草莓”模型的部分預覽版——OpenAI o1預覽版。這是一系列全新AI模型，能推理復雜的任務，解決比以前科學、編程、數學模型更難的問題。
▲OpenAI發布o1模型
OpenAI o1是全新系列AI模型的第一款。與以往模型不同的是，它擁有進化的推理能力，會在回答前進行縝密思考，生成一個長長的內部思維鏈，在競爭性編程問題上排名第89位，在美國數學奧林匹克預選資格賽中排名前500，在物理、生物、化學問題的基準測試中準確度超過了人類博士水平！
新發布的另一款o1 mini是一款更快、更小的模型，使用與o1類似的框架進行訓練。o1 mini擅長理工學科，尤其是數學和編程，其成本比o1預覽版便宜80%。
這兩款模型被OpenAI視為復雜推理任務的重大進步，因此被命名為o1，重置計數器，而非作為GPT系列的延續。
不過，推理增強版的o1模型，還是在9.9和9.11比大小這種“高階問題”上慘敗。
▲o1模型回答“比大小”問題
已經離開OpenAI創業的OpenAI創始成員、前特斯拉AI高級總監Andrej Karpathy今早發文吐槽：“o1-mini一直拒絕為我解決黎曼假設。模型懶惰仍然是一個主要的問題

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

大模型進展專欄第七期｜人工智能賦能科研范式重塑中國科學院 “磐石·科學基礎大模型”

博通發布Jericho4芯片：臺積電3nm工藝，可連接超100萬顆處理器

中山醫院獲批國家人工智能應用中試基地建設項目，將打造醫療AI創新策源地

“人工智能場景化應用創新與產業落地論壇”在哈爾濱舉行多領域創新成果集中亮相

以科技引領產業，繪人工智能發展新篇

向新而行｜人工智能的“頭雁”效應

全站最新

追覓連續六年年復合增長率超100% ，俞浩獲評「2025封面人物」

谷歌把AI大模型能力“壓縮”進手機，以后玩游戲全靠“吼”

培訓即上崗！一條閉環服務鏈，打通就業“最后一公里”

摩爾線程張建中：智算集群將做到50萬卡、100萬卡規模

熱門推薦

中東人工智能金融科技公司Alaan獲4800萬美元融資，助力企業智能化管理！

大模型進展專欄第七期｜人工智能賦能科研范式重塑中國科學院 “磐石·科學基礎大模型”

博通發布Jericho4芯片：臺積電3nm工藝，可連接超100萬顆處理器

美國證券交易委員會成立人工智能專責小組助力創新與效率提升

伊利諾伊州立法禁止人工智能提供心理健康服務

中山醫院獲批國家人工智能應用中試基地建設項目，將打造醫療AI創新策源地

“人工智能場景化應用創新與產業落地論壇”在哈爾濱舉行多領域創新成果集中亮相

國家安全部：警惕人工智能“數據投毒”

“人工智能+”覆蓋12個領域張家口人工智能應用場景加速落地

推動區域人工智能技術應用中科聞歌人工智能研發中心啟用

以科技引領產業，繪人工智能發展新篇

向新而行｜人工智能的“頭雁”效應

警惕人工智能數據污染：0.01%虛假文本可使有害輸出增11.2%

庫克：從未對蘋果的產品規劃感到如此興奮

獨家對話中國聯通趙亞暉，AI時代的“數據燃料”是如何煉成的？ | 浪潮對話