OpenAI于12月11日發布了ChatGPT-5.2,并稱其為首個在表現上達到或超過人類專家水平的版本。然而,這一說法在一項基礎測試中受到質疑。
當地時間12月18日,據外媒Futurism報道,在為小學生生成按英文字母順序排列的動物掛圖測試中,ChatGPT-5.2漏洞百出。這一問題最早由BCA Research首席全球策略師彼得貝雷津發現。他在11月測試ChatGPT-5.1時,模型生成的內容只包含25個字母,遺漏了“Z”。
在測試ChatGPT-5.2時,問題依然存在。模型生成的字母表只覆蓋了24個字母,遺漏了“U”和“Z”,并在“T”之后直接跳到“Y”,對應“Yak”。生成的字母表最終以“X”結束,對應“X-ray fish”,但插圖卻是一只斑馬。
此外,插圖本身也存在明顯異常,如肢體結構怪異的袋鼠、長著兩條尾巴的鬣蜥、五官混亂的獨角鯨,以及帶有貓臉特征的刺猬。在后續提示中,情況并未改善。模型生成了25個字母,“Y”再次取代了“U”,并被解釋為“Unicorn”。結尾處出現兩個“X”,一個對應“fish”,另一個對應“X-ray fish”,卻仍舊使用了一張斑馬插圖。
更令人困惑的是,模型還將提示語本身混入生成內容,“A is for alligator,B is for bear…”直接出現在海報標題中。





京公網安備 11011402013531號