最近兩周,“手辦化”突然就火了。
事情是這樣的,大約在兩周之前,大模型競技場LMArena上架了一個只聞其名,不見其身的神秘模型——“nano banana”,按照官方說法,這是一個頂尖的圖像生成與編輯模型,能實現前所未有的創作控制力。
結果呢?整個互聯網的AIGC玩家,都在用它變身“手辦大師”。
不開玩笑,小雷是真被這玩意給刷屏了,這兩天一打開群聊,就能看到無法無天的群友們在拿這玩意瘋狂整活,有把自己頭像做成限量版GK模型的,有把自家貓狗“手辦化”的,甚至還有給剛發布的《黑神話:鐘馗》弄雕像和游戲盒的,推特上的國外網友玩得更是樂此不疲,看得我都有點心癢癢的。
幸好,這次我們不用眼巴巴地羨慕了。
![]()
(圖源:LMArena)
隨著Google的正式發布,如今Gemini 2.5 Flash Image已經通過Gemini API和Google AI Studio向公眾開放預覽,用戶只需訪問官網,就能直接體驗到下一代圖像模型的威力。
最重要的是,這玩意在AI Studio里進行測試是完全免費的,對于我們這種熱愛嘗鮮的玩家來說,簡直是把探索未來的門檻給直接鏟平了。
話不說多,我們這邊直接開整!
Gemini 2.5 Flash Image讓人人成手辦大師
想體驗這個功能的話,其實還蠻簡單的就是了。
打開Google AI Studio網頁版,在Generate media選項卡下就能找到Gemini 2.5 Flash Image。界面非常直觀,一個提示詞輸入框,一個上傳圖片的區域,這就是通往新世界的大門。
要做的事情很簡單,上傳一張圖片,然后用自然語言告訴它我們想要生成的內容就像。
![]()
(圖源:Gemini)
話不多說,先來看圖。
首先,我們準備一張自己想要進行“手辦化”的圖片,可以是動漫,也可以是真人,甚至不必是全身照,比如這張來自漫畫《捉摸不透的刑警織子桑》里的有阿谷織子的單人圖就很不錯。
接下來,輸入提示詞:
Please turn this screenshot of the character into a kotobukiya figure. Behind it, place a toy box printed with the character's image. Next to it, add a computer with its screen displaying the design, complete with the the character. In front of the box, add a round plastic base for the figure and have it stand on it. The PVC material of the base should have a crystal-clear, translucent texture, and set the entire scene indoors.
最終成品如下:
![]()
(圖源:雷科技自制)
不得不說,Gemini對“手辦質感”的理解已經超出了我的預期。
這張圖的生成效果達到了以假亂真的水準,無論是手辦本身的材質(蕾絲、皮革、肌膚)、包裝盒上的文字和品牌Logo,還是背景電腦屏幕上復雜的建模界面都很不錯,只有高度模糊的背景能看出些端倪。
再來些熱門的,比如說《黑神話:鐘馗》:
![]()
(圖源:雷科技自制)
接著試一下大家都關心的名人,比如說馬斯克:
![]()
(圖源:雷科技自制)
從結果來看,轉換效果可以說是幾無失手,非常成熟。
如果你想玩點更高級的,我們把這張生成的圖片,扔進同樣是豆包視頻生成中,用提示詞“畫面外的人從兩邊伸出亞洲人的雙手,拿起手辦把玩并展示桌上手辦的視頻”,生成一段把玩手辦的視頻。

(圖源:雷科技自制)
如果用提示詞“360度緩慢旋轉這個手辦,轉臺拍攝”,就能生成一段平滑的環繞展示視頻。

(圖源:雷科技自制)
最后還可以用Meshy或者騰訊混元3D,將手辦3D建模化,我們就能得到一個可以自由旋轉、縮放的3D模型。
![]()
(圖源:雷科技自制)
雖說后兩步借助了其他工具,但由Gemini 2.5 Flash Image產出的高質量初始素材,是整個工作流成功的基石。這種打破次元壁的做法,讓每個人都能低成本地實現從一個想法到3D產品的完整流程,在過去是很難想象的。
修圖能力更強了,其實是終極版PS?
不過,人人都在玩手辦化,是不是有點大材小用了?
我們不妨轉換一下思路,把它當成終極版的PS來用?
舉個例子吧,比如說那些珍貴的、但因年代久遠而模糊破損的老照片,它能不能修復呢?
我上傳了一張黑白老照片,照片上有劃痕和噪點,清晰度也很低。
![]()
(圖源:X)
接下來,輸入提示詞:
Restore this old photo, remove scratches and noise, increase the resolution, and colorize it realistically.
![]()
(圖源:Gemini)
答案是,“完全可以,而且效果驚人”。
可以看到,Gemini 2.5 Flash Image不僅清除了物理損傷,還通過算法補全了缺失的細節,面部的紋理和眼神光都得到了合乎邏輯的重現。上色的效果也偏近自然,沒有出現早期AI上色那種“塑料感”,充滿了溫暖的時代氣息。
再試試設計行業里源遠流長的梗,“把白天改成黑夜”這種要求,它能不能實現呢?
![]()
(圖源:雷科技)
提示詞:
Change the scene to night time, turn on the streetlights and the lights inside the buildings, make it look like it's raining slightly.
![]()
(圖源:Gemini)
只能說,Gemini 2.5 Flash Image在語義理解和光影重構這塊,已經達到了很出彩的水平。它不僅僅是簡單地調暗畫面,而是真正理解了“夜晚”、“燈光”、“下雨”這些概念,并合乎物理邏輯地對整個畫面進行了重新渲染。
最后,我也試了一下它的風格切換能力。這次就拿《Panty&Stocking》里的畫面做例子:
![]()
(圖源:X)
提示詞:
Convert this scene into a photorealistic movie still from a 1990s live-action film, directed by Wong Kar-wai.
![]()
(圖源:Gemini)
很有意思,它不僅做到了“三次元化”,還微妙地捕捉到了王家衛電影那種獨特的色彩、光影和氛圍感。
這種跨越媒介和導演風格的無縫切換,為藝術創作提供了更多可能。
不算完美,卻堪稱圖片AIGC新標桿
不可否認,Gemini 2.5 Flash Image的發布,標志著AI在圖像生成領域實現了重大突破。
就像我展示的那樣,曾經需要專業人士花費數小時在PS里用蒙版、圖層、筆刷精雕細琢的工作,如今只需一句自然語言就能瞬間完成,甚至修圖效果比我這種半吊子還要好上不少,屬實有點慚愧。
目前該模型在預覽階段,并非完美無瑕。
在處理極其復雜的、包含大量人物的場景時,Gemini偶爾還是會出現輕微的邏輯錯誤或細節失真。對于一些過于抽象或違反物理常識的指令,它的理解能力也還有提升空間。
不管怎么說,Gemini 2.5 Flash Image算是為AI圖片生成應用樹立了一個新的標桿。
可以預見的是,隨著技術的不斷成熟和成本的降低,未來手機、電腦的相冊和編輯器都可能會原生集成這項功能,就像AI消除、AI擴圖那樣走進尋常百姓家。無論是專業設計師還是普通用戶,每個人都有機會輕松上手,將自己腦海中的創意和對美的理解,更直觀、更高效地展現出來。
修圖有手就行?或許真的不是夢。





京公網安備 11011402013531號