就在谷歌暗示將發(fā)布Gemini 3.0 Flash模型時,OpenAI搶先發(fā)布了其新一代圖像模型GPT Image 1.5,對標(biāo)谷歌的Nano Banana。從跑分來看已經(jīng)超過谷歌奪得第一,不過實(shí)際用戶測試反饋呈現(xiàn)兩極分化,不少人認(rèn)為其AI味較重。
為了制造話題,OpenAI直接拿CEO奧爾特曼(Sam Altman)當(dāng)案例演示生圖效果。而奧爾特曼本人也曬出了自己用GPT Image 1.5生成的“消防員寫真年歷”,被調(diào)侃“畫風(fēng)辣眼”。
![]()
OpenAI表示,這一代模型具備更強(qiáng)的指令遵循,更精準(zhǔn)的圖像編輯,也能較好地保留細(xì)節(jié),生成速度是上一代模型的4倍。新的圖像模型今天在ChatGPT中面向所有用戶推出,并在API中作為GPT Image 1.5提供。
這次OpenAI還實(shí)施了降價措施,GPT Image 1.5中的圖像輸入和輸出比上一代便宜了20%,因此用戶可以在相同的預(yù)算下生成和迭代更多的圖像。GPT Image 1.5 按token定價,價格取決于分辨率和質(zhì)量設(shè)置,高質(zhì)量1MP 圖像的價格約為每千張133美元,低質(zhì)量每千張 9美元。
在各類測評上,GPT Image 1.5已經(jīng)登上榜一。例如,在競技場Artificial Analysis上,GPT Image 1.5 在文生圖和圖像編輯兩項(xiàng)功能上均位列第一,超越了排在第二的Nano Banana Pro。尤其在文生圖項(xiàng)目中,領(lǐng)先優(yōu)勢達(dá)46分,在圖像編輯則只高出了4分。
![]()
Artificial Analysis表示,與早期的 OpenAI 圖像模型相比,GPT Image 1.5展現(xiàn)出更高的圖像質(zhì)量和更快的保真度。
不過,與谷歌Nano Banana Pro的實(shí)際對比才是行業(yè)關(guān)注的焦點(diǎn)所在。有觀點(diǎn)認(rèn)為這是OpenAI被谷歌打亂節(jié)奏后的倉促應(yīng)戰(zhàn),也有評測指出該模型確實(shí)具備與谷歌一較高下的實(shí)力。
第一財(cái)經(jīng)記者用GPT Image 1.5和Nano Banana Pro分別進(jìn)行了生圖測試,從這個測試來看,兩個模型各有優(yōu)缺點(diǎn)。GPT Image 1.5在畫面質(zhì)感和提示詞遵循上表現(xiàn)更好,但對中文支持明顯不足,生成文字錯誤頻出;Nano Banana Pro在文字準(zhǔn)確性上占優(yōu),卻在構(gòu)圖指令遵循上屢屢失誤。
![]()
GPT Image 1.5最大的問題或許是對于中文的支持,文字錯誤非常顯眼,但在畫面質(zhì)感上做得很出色。隨后記者再次提示更正文字錯誤,并切換橫圖,更開闊的背景。GPT Image 1.5的文字輸出仍然是失敗的,但遵守了其他提示詞。
![]()
Nano Banana Pro則是在“第一財(cái)經(jīng)”的文字輸出上做到了準(zhǔn)確,但封面仍有其他錯誤的中文字體,且畫面格式一直是豎圖,后面記者幾次提示橫向比例的構(gòu)圖均輸出失敗,在提示詞遵守上模型仍有問題。
![]()
從整體審美來看,GPT Image 1.5的輸出更符合大眾喜好,但在準(zhǔn)確性和中文支持上,Nano Banana Pro略勝一籌。
網(wǎng)友和機(jī)構(gòu)也從多個方向進(jìn)行了測試。Artificial Analysis用目前排行前四的圖像模型做了一些測試。第一個是文生圖:一只好奇的貓從一堆秋葉中探出頭來。
![]()
從畫面來看,這個場景里,GPT Image 1.5和Nano Banana Pro表現(xiàn)得都不錯,不過后者的場景細(xì)節(jié)明顯更多更真實(shí)。
也有網(wǎng)友實(shí)測發(fā)現(xiàn),GPT-Image 1.5在生動的圖像上表現(xiàn)很好,但在信息圖表上表現(xiàn)糟糕。
![]()
更多普遍的反饋是,ChatGPT的圖片看起來比谷歌的Nano Banana Pro假得多。
例如,在一個女士對鏡自拍肖像的測試中,雖然ChatGPT的光影、皮膚的質(zhì)感都很好,但由于背景虛化過度美化,反而會被一眼識別“AI味兒”,而Nano Banana Pro生成的圖片背景細(xì)節(jié)很多,難辨真假。
![]()
有行業(yè)人士認(rèn)為,Nano Banana Pro在真實(shí)感與自然度上的優(yōu)勢,對電商、創(chuàng)意等落地場景更為有利。這也意味著,在貼近實(shí)際應(yīng)用的賽道中,谷歌或許仍是更受青睞的一方。
谷歌此前發(fā)布的Gemini 3系列模型,給OpenAI帶來了近兩年最大的逆風(fēng)挑戰(zhàn),大模型霸主的地位受到挑戰(zhàn)。OpenAI隨后拉響“紅色警報(bào)”應(yīng)對谷歌競爭,并在一周前推出了GPT-5.2反擊,雖然評分不錯但用戶差評如潮。ChatGPT 用戶一致認(rèn)為 GPT-5.2 太平淡、安全過度、“不像是升級,反而像是倒退”。
此次旗艦圖像模型的更新也被認(rèn)為是對谷歌的一次回?fù)簦壳翱磥恚m然從競技場的評分來看會更高,但用戶實(shí)際評價卻兩極分化。谷歌Nano Banana系列模型已經(jīng)拉高了用戶的預(yù)期,此次更新也并不是行業(yè)一次顛覆式的飛躍,很難滿足用戶期待。
圖片更真實(shí)、沒有“AI味”仍然是用戶心中重要的評判標(biāo)準(zhǔn),也是在商業(yè)化場景中落地的關(guān)鍵,OpenAI仍需在真實(shí)感塑造上向谷歌看齊——榜單上的分?jǐn)?shù)只是開始,真正贏得用戶,仍需跨越那道“像與不像”的鴻溝。





京公網(wǎng)安備 11011402013531號