12月4日凌晨,GitHub 與 DesignArena 同步流出 OpenAI 內(nèi)部代號“企鵝”(Penguin)的全新模型矩陣,四檔推理預(yù)算首次曝光:旗艦 Emperor512、中端 Rockhopper64、輕量 Macaroni16與零推理 Mumble0,覆蓋從云端到邊緣的全場景需求 。
圖源備注:圖片由AI生成,圖片授權(quán)服務(wù)商Midjourney
512推理預(yù)算!Emperor 或成 GPT-5.2核心
內(nèi)部文件顯示,Emperor 擁有512單位“juice”推理預(yù)算,為現(xiàn)行模型8-10倍,端到端延遲卻控制在80ms 以內(nèi),實(shí)現(xiàn)“零等待”對話體驗(yàn);代碼路徑已嵌入實(shí)時剪枝與動態(tài)計算分配,疑似為明年 GPT-5.2提供底層架構(gòu) 。
四檔預(yù)算=四種 latency:Macaroni 主打極速,Mumble 徹底去推理
- Rockhopper(64)(中端)定位“推理+速度”平衡,目標(biāo)替代 GPT-4.5
- Macaroni(16)面向移動端,首次在8Gen3芯片跑通70B 模型
- Mumble(0)完全跳過推理步驟,響應(yīng)時間<50ms,用于高頻自動完成與語音打斷場景
記憶搜索同步曝光:一鍵召回對話上下文
同批泄露的代碼顯示,ChatGPT 將新增“Memory Search”按鈕,用戶輸入自然語言即可即時檢索歷史記憶,無需再手動翻找聊天記錄;該功能已內(nèi)測,預(yù)計與企鵝家族模型一同上線 。
Shallotpeat & Garlic 接踵而至:OpenAI 拉響紅色警報
The Information 補(bǔ)充,OpenAI 下周或發(fā)布內(nèi)部代號 Shallotpeat 的新推理模型,性能已領(lǐng)先 Gemini3;另一款 Garlic 完成預(yù)訓(xùn)練,2026年初以 GPT-5.2/5.5形式推出,主打“小參數(shù)+高密度知識”路線,直接對標(biāo)谷歌“預(yù)訓(xùn)練飛躍”。
行業(yè)震蕩:開源與閉源同時提速
- 對于開發(fā)者,四檔預(yù)算意味著同一代號即可調(diào)用“延遲-成本-精度”不同組合,API 定價有望下探30%
- 對于競品,OpenAI 首次把“推理 budget”做成明碼標(biāo)價,迫使 Google、Anthropic 跟進(jìn)類似分級
- 對于監(jiān)管,零推理 Mumble 的極速響應(yīng)可能放大錯誤率,安全評估或成為發(fā)布前最后一道關(guān)卡
OpenAI 尚未公布企鵝家族具體發(fā)布日期,但已在 DesignArena 開啟盲測,獲勝模型將直接并入 ChatGPT Plus 與 Enterprise 通道。AIbase 將持續(xù)跟蹤,第一時間帶來基準(zhǔn)成績與 API 定價細(xì)節(jié)。





京公網(wǎng)安備 11011402013531號