當地時間11月20日,在用Gemini 3“屠榜”大模型圈后,谷歌又甩出了另一張王牌Nano Banana Pro (Gemini 3 Pro圖像),在海內外社交媒體上網友已經玩瘋了,從眾多一手測試來看這款模型進步依然很大。
![]()
谷歌表示,Nano Banana Pro使用Gemini最先進的推理和現實世界的知識,比以往任何時候都更好地可視化信息,比如創建和編輯更復雜的視覺效果、信息圖表等等。
具體來看,Nano Banana Pro這次升級有幾個重要的方向,一個是更高清,可以2K和4K 高分辨率直出,這對專業用戶來說非常重要。此外支持更好更長的文字生成、多語言支持,可直接在圖片中完成翻譯。在攝影質量上,支持拍攝角度、焦點、色彩的調整。圖片比例可以進行1:1到9:16各種調整,以及更好的角色一致性。
第一財經記者進行了兩個方向的測試,Nano Banana Pro確實相比上一代進步很多,不過模型在處理一些細節時仍有缺陷。
記者第一次是讓Nano Banana 的第一代和現在的Pro分別生成一張未來的新聞編輯部的照片,一個未來的AI機器人繪制雜志的封面,旁邊幾位專業人士在指導繪畫細節,強調未來感、高清、細節。
![]()
可以看到Nano Banana生成的雜志圖片名稱是錯誤的,并且人物肢體還會有多出的現象。
切換到Nano Banana Pro后,一些細節更真實了,雜志的名字都寫對了,并且模型還在左下角加了條形碼。不過這兩張圖片的清晰度仍然不夠,這或許是因為免費的原因。
![]()
讓模型將畫面切換成動漫風格。
![]()
在官方博客中,谷歌表示可以用多張圖像融合,并保持角色的一致性。記者第二次按照這一方向,輸入了5張照片,包括4張寵物照片和一張景色,簡單提示模型將它們融合在一起。
![]()
從輸出的圖像來看,這一融合是合格的,但仍未超出預期,更像是將幾張圖摳圖拼貼在一起了,角色和場景沒有互動,并且其中一張圖的角色大改,并沒有遵守角色一致性。
記者進一步提示Nano Banana Pro,讓這些角色快樂地玩耍,畫面需要生動,但模型給出的答案只是增加了原圖中的角色,其他都未有變動。
![]()
從記者的測試來看,Nano Banana Pro模型相比上一代有進步,但缺陷仍有,并不像目前業界測試的結果那樣出色。不過,模型能力或許也取決于會員充值以及提示詞的精確性。
例如,在谷歌給出的示意圖里,使用 14 張玩偶圖像生成一張圖,在精細的提示詞下畫面融合得非常自然。
![]()
有博主用Nano Banana Pro 測試電商圖效果,測試的重點是“光影控制”和“材質還原”,他發現模型已經能精準理解“側逆光”“柔光箱”以及不同材質的反射率。只要提示詞足夠好,效果已經非常不錯,對中小賣家很友好。
![]()
還有網友讓模型生成一些關于ITF跆拳道的說明。他表示,效果相當不錯,“它是第一個真正能區分ITF跆拳道道服和奧運跆拳道道服的模型。甚至連標志都自動修正了。”
![]()
在當前的用戶政策上,谷歌給出了幾個選擇。面向消費者和學生,在 Gemini 應用中選擇“創建圖像”并使用“思考”模型,就能體驗 Nano Banana Pro。免費用戶將獲得有限的免費配額,用完后將恢復到原有的 Nano Banana 模型。而Google AI Plus、Pro 和 Ultra 訂閱用戶可獲得更高的配額。
開發者和企業則是可以在Gemini API 和 Google AI Studio 以及 Google Antigravity 中使用,用于創建豐富的 UX 布局和模型。
就在今年8月,谷歌發布了第一代Nano Banana(Gemini 2.5 Flash Image模型),在當時迅速登頂多個主流圖像排行榜,成為新晉性能冠軍。同時由于模型能夠將人物照片變成“3D打印手辦”,短時間內形成全球范圍內的破圈效應。
在此前的媒體溝通會上,谷歌Gemini App的產品管理副總裁克里斯·斯特魯哈爾(Chris Struhar)提到,Gemini應用的月活用戶數在短短1個季度內,就從4.5億暴增至6.5億,其中一個關鍵因素是Nano Banana帶來的病毒式傳播效應,尤其是在泰國、印度尼西亞、印度等國家,這是一款非常成功的產品。
從當前的用戶反饋看,此次升級的Nano Banana Pro或許會延續上一代的熱度,并且在圖像專業領域有更深入的應用。
伴隨著近日新模型的發布,谷歌的股價也在這幾天履創歷史新高,就在昨夜,谷歌一度大漲超3%,總市值達到3.65萬億美元,超過微軟進入美股總市值前三。隨著昨夜美股科技板塊的大跌,最終谷歌收跌于289.45美元/股,總市值3.49萬億美元。不過,今年以來谷歌股價漲幅仍超過50%。





京公網安備 11011402013531號