ChatGPT-5.2生成字母掛圖錯誤頻出“人類專家水平”遭質疑

IP屬地中國·北京 三言科技 時間：2025-12-20 20:10:46

OpenAI于12月11日發布了ChatGPT-5.2，并稱其為首個在表現上達到或超過人類專家水平的版本。然而，這一說法在一項基礎測試中受到質疑。

當地時間12月18日，據外媒Futurism報道，在為小學生生成按英文字母順序排列的動物掛圖測試中，ChatGPT-5.2漏洞百出。這一問題最早由BCA Research首席全球策略師彼得貝雷津發現。他在11月測試ChatGPT-5.1時，模型生成的內容只包含25個字母，遺漏了“Z”。
在測試ChatGPT-5.2時，問題依然存在。模型生成的字母表只覆蓋了24個字母，遺漏了“U”和“Z”，并在“T”之后直接跳到“Y”，對應“Yak”。生成的字母表最終以“X”結束，對應“X-ray fish”，但插圖卻是一只斑馬。
此外，插圖本身也存在明顯異常，如肢體結構怪異的袋鼠、長著兩條尾巴的鬣蜥、五官混亂的獨角鯨，以及帶有貓臉特征的刺猬。在后續提示中，情況并未改善。模型生成了25個字母，“Y”再次取代了“U”，并被解釋為“Unicorn”。結尾處出現兩個“X”，一個對應“fish”，另一個對應“X-ray fish”，卻仍舊使用了一張斑馬插圖。
更令人困惑的是，模型還將提示語本身混入生成內容，“A is for alligator,B is for bear…”直接出現在海報標題中。

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

2025年流星雨迎來謝幕演出小熊座流星雨22日極大

鴻蒙正奔騰！解碼中國自主操作系統的生態成熟好用的極限突圍

我國成功發射通信技術試驗衛星二十三號

寶馬3系全球產量突破1800萬輛，50年傳奇仍在繼續

給AI一雙眼睛：XR眼鏡正在重塑下一代智能終端

摩爾線程技術路線圖全面公開！刷新國產GPU推理天花板，新架構能效飆10倍

全站最新

2025年流星雨迎來謝幕演出小熊座流星雨22日極大

鴻蒙正奔騰！解碼中國自主操作系統的生態成熟好用的極限突圍

我國成功發射通信技術試驗衛星二十三號

寶馬3系全球產量突破1800萬輛，50年傳奇仍在繼續

熱門推薦

上饒農商行被罰240萬，上饒銀行被罰170萬

2025年流星雨迎來謝幕演出小熊座流星雨22日極大

雷軍轉發！小米汽車又獲獎再引發輿論安全追問

鴻蒙正奔騰！解碼中國自主操作系統的生態成熟好用的極限突圍

我國成功發射通信技術試驗衛星二十三號

寶馬3系全球產量突破1800萬輛，50年傳奇仍在繼續

降息，突發！集體拉升，近8萬人爆倉！

給AI一雙眼睛：XR眼鏡正在重塑下一代智能終端

摩爾線程技術路線圖全面公開！刷新國產GPU推理天花板，新架構能效飆10倍

中科大造出首個紫外光譜成像芯片，成本有望直降99%

將RNA的自毀密碼寫入塑料：科學家實現高分子材料的可編程降解

摩爾線程重磅發布：新一代GPU架構“花港”能效提升10倍，系列芯片明年量產上市，推出AI算力筆記本

長安汽車獲得首塊L3級自動駕駛專用正式號牌

供應鏈金融助力發展！2025大宗商品國際化發展大會平行活動舉行

中國網絡空間安全協會盧衛：AI治理應分類，嚴管高風險場景