![]()
↑閱讀之前記得關注+星標??,,每天才能第一時間接收到更新
Sam Altman 反擊谷歌,OpenAI新旗艦圖像模型來了
就在剛剛,OpenAI正式發布了新版ChatGPT Images,由全新的旗艦圖像生成模型GPT Image 1.5驅動
這一次,無論是從零開始生成圖像,還是編輯現有照片,新模型都能實現“所想即所得”
![]()
核心升級主要體現在三個方面:精準修圖且保留細節、指令遵循能力更強,以及生成速度提升了4倍
我立馬就測試了兩個手頭的case:ChatGPT Images vs Nano Banana Pro
提示詞
這是一張室內人像寫真風格的照片,整體偏向干凈、柔和、略帶時尚感與親密氛圍,下面我從構圖、人物、服裝、姿態、光線與整體氣質幾個層面來忠實、細致地描述:
?
一、整體構圖與環境
?豎幅構圖,人物幾乎占據畫面主體,視覺重心集中在人物的上半身與面部。
?場景是一個簡約現代的室內空間,背景為大面積純白色墻面,干凈、無雜物,刻意弱化環境存在感。
?人物坐在一張黑色皮質沙發上,沙發表面線條硬朗,與人物柔和的膚色形成對比。
?沙發上鋪著一塊黑白相間的長毛絨毯,毛感明顯,增加了畫面的層次與觸感?
二、人物外貌與面部特征
?人物為一位年輕女性,整體氣質偏清秀、柔和。
?膚色白皙均勻,質感細膩,幾乎看不到明顯瑕疵。
?臉型偏鵝蛋臉,下頜線柔和,沒有明顯棱角。
?五官比例協調:
?眼睛偏大,雙眼皮清晰,眼神平靜、直視鏡頭,帶有一點若有若無的疏離感。
?鼻梁挺直但不夸張。
?嘴唇偏小,唇色自然,表情克制,沒有明顯微笑。
?整體妝容為清淡自然妝:
?底妝輕薄
?眼妝干凈,沒有明顯煙熏或夸張色彩
?唇妝偏裸色或淡粉色
?
三、發型與發質
?長直發,發色為偏暖的深棕色。
?中分發型,分縫筆直,左右對稱。
?頭發順直、貼合,發尾自然垂落至腰部附近,整體顯得柔順、有光澤。
?發量看起來較多,線條干凈,沒有明顯卷度。
?
四、服裝細節
?穿著一件白色蕾絲連衣裙:
?無袖設計,露出肩部與手臂
?V 領或淺領口,領口處有精細的蕾絲花紋
?裙身貼合身體曲線,但并不夸張
?裙擺長度偏短,停留在大腿中上部
?面料為蕾絲+內襯結構,蕾絲紋理清晰,風格偏女性化、柔美。
?
五、姿態與肢體語言
?人物以側坐姿坐在沙發上:
?上半身微微前傾
?一只手自然搭在沙發或毛毯上
?另一只手輕放在腿部
?雙腿彎曲收攏,姿態顯得放松而內斂。
?整體肢體語言偏安靜、克制、略帶親密但不過分張揚。
?
六、光線與攝影風格
?使用的是柔和的棚拍或自然補光:
?光線均勻,沒有強烈陰影
?面部和身體輪廓被柔化
?色溫偏中性或微暖,突出膚色的細膩感。
?背景虛化不明顯,但因背景簡潔,人物自然突出。
?整體風格接近商業人像 / 時尚寫真 / AI 或高精修風格。
?
七、整體氣質總結
這張照片給人的感覺是:
?干凈
?精致
?柔和
?帶一點冷靜與疏離
?偏“被觀看”的人像美學,而非抓拍或紀實
2k分辨率
這是生成的效果:
![]()
第二個case:
提示詞:
{
描述:一幅超逼真的 3D 等距視角杰作,描繪了一幅展開在光滑深色木桌上的魔法地圖。地圖繪制在一張古老而飽經風霜的羊皮紙卷軸上,但畫面中的景色以立體模型的形式躍然紙上。巍峨的巖石山脈,白雪皚皚的山峰,穿透縷縷白云;一條蜿蜒的碧綠河流從中心流過;山麓覆蓋著茂密蔥郁的松林。羊皮紙邊緣呈鋸齒狀,左側飾有精美的復古書法,角落則繪有羅盤玫瑰圖案。畫面采用溫暖的電影級光照,焦點清晰,紋理細節豐富,2K 分辨率,以奇幻冒險為主題。
"negative_prompt": "扁平的,2D 的,簡單的圖畫,模糊的,低質量的,扭曲的,有水印的,糟糕的人體結構,文字疊加,顆粒感強的",
“參數”: {
"aspect_ratio": "2:3",
"風格": "電影級 3D 渲染",
"視圖": "等距"
}
}
生成的效果:
![]()
看起來ChatGPT Images指令遵循的要比NBR要強(人像),審美能力還不好說
目前ChatGPT Images 在 大模型競技場圖像排名第一
![]()
接下來幾天我會大量測試,看看實際表現
與此同時,GPT Image 1.5 API也已同步上線,價格相比上一代直降20%
下面我們一起來看ChatGPT Images具體細節
精準修圖:指哪打哪,細節不丟
新版模型最大的亮點在于對用戶意圖的精準還原
當用戶要求對上傳的圖片進行編輯時,模型能夠更可靠地遵循指令,僅改變用戶要求的部分。
而在這一過程中,原圖中光線、構圖以及人物外觀等關鍵要素,都能在輸入、輸出及后續的連續編輯中保持一致
這就意味著,ChatGPT現在不僅能完成更實用的照片修飾,還能實現更逼真的服裝和發型試穿。同時,它支持在保留原圖精髓的基礎上,進行風格化濾鏡和概念轉換
具體到編輯操作上,模型擅長多種類型,包括:
? 添加(Adding)
? 刪減(Subtracting)
? 組合(Combining)
? 混合(Blending)
? 移位(Transposing)
![]()
![]()
![]()
![]()
![]()
![]()
![]()
簡而言之,用戶可以在得到想要的改變的同時,不丟失讓圖片顯得特別的那些原始細節。OpenAI稱其為“口袋里的創意工作室”
創意與能力的全面進化
除了修圖,GPT Image 1.5在創意生成和基礎能力上也有顯著提升:
創意變換:模型可以通過改變和添加元素(如文本和布局)來實現創意轉化,同時保留重要細節,這個和Nano Banana Pro表現感覺差不多
![]()
![]()
![]()
![]()
![]()
![]()
![]()
更強的指令遵循:相比初代版本,新模型能更可靠地執行指令。這不僅利于精準修圖,也能在生成復雜的原創構圖時,按預期保留元素間的關系
![]()
文本渲染能力強悍升級:在處理更密集、更小的文本時,模型表現強悍
![]()
![]()
![]()
畫質提升:在渲染許多小人臉以及整體輸出的自然度等方面,質量均有改進
![]()
全新交互:無需提示詞也能玩
為了讓圖像探索更快捷,OpenAI在ChatGPT中推出了專門的Images主頁
用戶可以通過移動應用的側邊欄或chatgpt.com訪問該頁面。這里不再強制要求用戶編寫提示詞,而是內置了數十種預設的濾鏡和提示,幫助用戶快速啟動靈感
這些預設內容會定期更新,以反映當下的流行趨勢
API上線:更便宜,更適合企業
對于開發者和企業用戶,GPT Image 1.5 API也已同步開放。
相比GPT Image 1,新版API在圖像輸入和輸出的價格上便宜了20%,這意味著在相同預算下可以進行更多的生成和迭代。
在能力上,API版本繼承了ChatGPT Images的所有改進,特別是在圖像一致性方面表現更強:
能夠跨編輯保持品牌Logo和關鍵視覺元素的一致性
非常適合營銷材料制作(如圖形和Logo創作)
適用于電商團隊,可基于單一源圖像生成完整的產品目錄(包括不同變體、場景和角度)
目前,已有創意工具、電商、營銷軟件等領域的企業開始使用GPT Image 1.5。
最后
ChatGPT Images的新版本即日起向全球所有ChatGPT用戶和API用戶推送。
該功能跨模型工作,用戶在使用時無需進行額外選擇
至于今年早些時候推出的舊版ChatGPT Images,將作為一個自定義GPT(Custom GPT)保留,供有需要的用戶繼續使用
--end--
熬夜爆肝不易!最后記得??我,每天都在更新:歡迎點贊轉發推薦評論,別忘了關注我





京公網安備 11011402013531號