不圓 時(shí)令 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
爆火的神秘圖像編輯模型nano-banana,終于脫掉了“香蕉皮”!
就在今天,谷歌官方認(rèn)領(lǐng),并表明這個(gè)模型其實(shí)是Gemini 2.5 Flash Image。
![]()
最新一波官方Demo也來(lái)了:

還展現(xiàn)出了高超的圖像推理能力:

現(xiàn)在該模型可以在Gemini和Google AI Studio上免費(fèi)使用,同時(shí)API以每張圖像0.039$(折合人民幣0.28¥)的價(jià)格開(kāi)放。
模型的具體表現(xiàn)如何?一起來(lái)看~
![]()
出色的圖像編輯能力
官方給出了很多有趣的用法。
除了常規(guī)的修圖方式,它還可以合并最多三張圖片來(lái)創(chuàng)造新事物。
生成超現(xiàn)實(shí)藝術(shù),組合不同的照片元素,或無(wú)縫融合物體、顏色和紋理。
![]()
或者輕松實(shí)現(xiàn)設(shè)計(jì)想法。
![]()
還可以用幾張照片生成堪稱(chēng)電影畫(huà)面的連貫劇情故事。
![]()
而在官方實(shí)錘之前,網(wǎng)友們也早就被nano-banana的各種私家case吸引,開(kāi)啟瘋狂討論。
比如說(shuō)精準(zhǔn)改變面部表情和天氣。
![]()
或者讓禿頭男人重新?lián)碛胁煌l(fā)型。
![]()
網(wǎng)友表示:PhotoShop岌岌可危。
![]()
畢竟這個(gè)“香蕉”不僅可以完成平面圖像的編輯,甚至還可以進(jìn)行2D到3D的轉(zhuǎn)換。用戶只需提供一張普通的2D圖片,系統(tǒng)就可自動(dòng)生成相應(yīng)的3D視角,每一個(gè)角度都是恰到好處、和諧統(tǒng)一。
![]()
最最最牛的是,它竟然還可以進(jìn)行圖像推理。勾股定理so easy,計(jì)算角度手拿把掐,識(shí)別圖像里的水母結(jié)構(gòu),竟然也是瞬間反應(yīng),堪稱(chēng)你畫(huà)我猜AI版。
說(shuō)實(shí)話,最讓我佩服的是,當(dāng)我們要求此“香蕉”給出一個(gè)人從A到B的方案時(shí),它竟然直接生成一個(gè)梯子!
好好好,圖像編輯器真的能思考了。
我們自己也實(shí)測(cè)了一下這款模型,發(fā)現(xiàn)它確實(shí)很有意思:
給它一只貓貓,貓能環(huán)游世界。
![]()
提示詞:以這只貓為主角,生成旅游照。
![]()
提示詞:讓貓貓去故宮拍張自拍照。
![]()
如果不想做真實(shí)場(chǎng)景,讓林黛玉和孫悟空成為漫威英雄并肩戰(zhàn)斗也就一句話的事兒~
![]()
另外,它對(duì)光影的細(xì)節(jié)理解也相當(dāng)真實(shí)。
提示詞:一根香蕉被放在廚房臺(tái)面上,旁邊有水杯、刀具和切菜板,陽(yáng)光從窗戶照進(jìn)來(lái),香蕉投下自然陰影。
可以看到生成結(jié)果還是很不錯(cuò)滴,陽(yáng)光透過(guò)水杯折射的影子以及旁邊植物的影子都還算合理。
![]()
它還能夠很好地抓取角色特征,不出意外地改變角色主體:
如果那一年,工藤新一喝下的并不是縮小藥水,而是……
![]()
神秘香蕉模型
Nano Banana最初出現(xiàn)在一個(gè)名為L(zhǎng)MArena的網(wǎng)站上,這是一個(gè)讓不同AI模型匿名進(jìn)行“戰(zhàn)斗模式”競(jìng)賽的地方。
而讓Nano-banana爆火的原因無(wú)他,表現(xiàn)實(shí)在太好了。
這又是一個(gè)SOTA級(jí)別的圖像編輯模型——而且在一開(kāi)始沒(méi)有任何官方文檔。
![]()
不過(guò)在官方宣布之前,已經(jīng)有一些人猜到了這是谷歌家族的一員。
一方面,該模型的表現(xiàn)與Gemini近期發(fā)布的多模態(tài)版本相似,這樣出色的性能很難是車(chē)庫(kù)團(tuán)隊(duì)的產(chǎn)品。
另一方面,它的發(fā)布策略——匿名發(fā)布、無(wú)品牌標(biāo)識(shí)、讓用戶群體自行探索——與DeepMind早期在匿名測(cè)試平臺(tái)上評(píng)估大語(yǔ)言模型的方式如出一轍。
還有一點(diǎn)額外原因:一些與谷歌有關(guān)聯(lián)的開(kāi)發(fā)者在社交媒體上發(fā)了奇怪的香蕉內(nèi)容
![]()
有網(wǎng)友問(wèn)到Google為什么要選擇秘密發(fā)布,官方給出了這樣的解釋?zhuān)?/p>
正在為全球規(guī)模的發(fā)布做準(zhǔn)備工作。
![]()
網(wǎng)友:何時(shí)發(fā)布完整版本
既然官方都那樣說(shuō)了,網(wǎng)友們也坐不住了。
紛紛表示:那我們能用完整版了嗎?
![]()
![]()
不過(guò),雖然這個(gè)模型在圖像生成的表現(xiàn)確實(shí)很好,但并不意味著它沒(méi)有問(wèn)題——
尤其是在大公司的服務(wù)政策下,很容易出現(xiàn)一些讓人比較抓狂的情況:
![]()
![]()
有網(wǎng)友認(rèn)為,這是一個(gè)非常有趣的營(yíng)銷(xiāo)方式,并且確實(shí)達(dá)到了他們想要的效果。
![]()
![]()
感興趣的朋友也可以去試一下這個(gè)香蕉,哦不,這個(gè)Gemini 2.5 Flash Image。
參考鏈接:
[1]https://x.com/googleaistudio/status/1960344388560904213
[2]https://x.com/OfficialLoganK/status/1960343135436906754
[3]https://aistudio.google.com/prompts/new_chat?model=gemini-2.5-flash-image-preview
[4]https://techcrunch.com/2025/08/26/google-geminis-ai-image-model-gets-a-bananas-upgrade/
[5]https://deepmind.google/models/gemini/image/





京公網(wǎng)安備 11011402013531號(hào)