生成3D手辦還能互動！谷歌新模型太炸裂了：這是PS終局？

IP屬地中國·北京 編輯：唐云澤雷科技 時間：2025-08-31 20:23:42

最近兩周，“手辦化”突然就火了。
事情是這樣的，大約在兩周之前，大模型競技場LMArena上架了一個只聞其名，不見其身的神秘模型——“nano banana”，按照官方說法，這是一個頂尖的圖像生成與編輯模型，能實現前所未有的創作控制力。
結果呢？整個互聯網的AIGC玩家，都在用它變身“手辦大師”。
不開玩笑，小雷是真被這玩意給刷屏了，這兩天一打開群聊，就能看到無法無天的群友們在拿這玩意瘋狂整活，有把自己頭像做成限量版GK模型的，有把自家貓狗“手辦化”的，甚至還有給剛發布的《黑神話：鐘馗》弄雕像和游戲盒的，推特上的國外網友玩得更是樂此不疲，看得我都有點心癢癢的。
幸好，這次我們不用眼巴巴地羨慕了。

（圖源：LMArena）
隨著Google的正式發布，如今Gemini 2.5 Flash Image已經通過Gemini API和Google AI Studio向公眾開放預覽，用戶只需訪問官網，就能直接體驗到下一代圖像模型的威力。
最重要的是，這玩意在AI Studio里進行測試是完全免費的，對于我們這種熱愛嘗鮮的玩家來說，簡直是把探索未來的門檻給直接鏟平了。
話不說多，我們這邊直接開整！
Gemini 2.5 Flash Image讓人人成手辦大師
想體驗這個功能的話，其實還蠻簡單的就是了。
打開Google AI Studio網頁版，在Generate media選項卡下就能找到Gemini 2.5 Flash Image。界面非常直觀，一個提示詞輸入框，一個上傳圖片的區域，這就是通往新世界的大門。
要做的事情很簡單，上傳一張圖片，然后用自然語言告訴它我們想要生成的內容就像。

（圖源：Gemini）
話不多說，先來看圖。
首先，我們準備一張自己想要進行“手辦化”的圖片，可以是動漫，也可以是真人，甚至不必是全身照，比如這張來自漫畫《捉摸不透的刑警織子桑》里的有阿谷織子的單人圖就很不錯。
接下來，輸入提示詞：
Please turn this screenshot of the character into a kotobukiya figure. Behind it, place a toy box printed with the character's image. Next to it, add a computer with its screen displaying the design, complete with the the character. In front of the box, add a round plastic base for the figure and have it stand on it. The PVC material of the base should have a crystal-clear, translucent texture, and set the entire scene indoors.
最終成品如下：

（圖源：雷科技自制）
不得不說，Gemini對“手辦質感”的理解已經超出了我的預期。
這張圖的生成效果達到了以假亂真的水準，無論是手辦本身的材質（蕾絲、皮革、肌膚）、包裝盒上的文字和品牌Logo，還是背景電腦屏幕上復雜的建模界面都很不錯，只有高度模糊的背景能看出些端倪。
再來些熱門的，比如說《黑神話：鐘馗》：

（圖源：雷科技自制）
接著試一下大家都關心的名人，比如說馬斯克：

（圖源：雷科技自制）
從結果來看，轉換效果可以說是幾無失手，非常成熟。
如果你想玩點更高級的，我們把這張生成的圖片，扔進同樣是豆包視頻生成中，用提示詞“畫面外的人從兩邊伸出亞洲人的雙手，拿起手辦把玩并展示桌上手辦的視頻”，生成一段把玩手辦的視頻。

（圖源：雷科技自制）
如果用提示詞“360度緩慢旋轉這個手辦，轉臺拍攝”，就能生成一段平滑的環繞展示視頻。

（圖源：雷科技自制）
最后還可以用Meshy或者騰訊混元3D，將手辦3D建模化，我們就能得到一個可以自由旋轉、縮放的3D模型。

（圖源：雷科技自制）
雖說后兩步借助了其他工具，但由Gemini 2.5 Flash Image產出的高質量初始素材，是整個工作流成功的基石。這種打破次元壁的做法，讓每個人都能低成本地實現從一個想法到3D產品的完整流程，在過去是很難想象的。
修圖能力更強了，其實是終極版PS？
不過，人人都在玩手辦化，是不是有點大材小用了？
我們不妨轉換一下思路，把它當成終極版的PS來用？
舉個例子吧，比如說那些珍貴的、但因年代久遠而模糊破損的老照片，它能不能修復呢？
我上傳了一張黑白老照片，照片上有劃痕和噪點，清晰度也很低。

（圖源：X）
接下來，輸入提示詞：
Restore this old photo, remove scratches and noise, increase the resolution, and colorize it realistically.

（圖源：Gemini）
答案是，“完全可以，而且效果驚人”。
可以看到，Gemini 2.5 Flash Image不僅清除了物理損傷，還通過算法補全了缺失的細節，面部的紋理和眼神光都得到了合乎邏輯的重現。上色的效果也偏近自然，沒有出現早期AI上色那種“塑料感”，充滿了溫暖的時代氣息。
再試試設計行業里源遠流長的梗，“把白天改成黑夜”這種要求，它能不能實現呢？

（圖源：雷科技）
提示詞：
Change the scene to night time, turn on the streetlights and the lights inside the buildings, make it look like it's raining slightly.

（圖源：Gemini）
只能說，Gemini 2.5 Flash Image在語義理解和光影重構這塊，已經達到了很出彩的水平。它不僅僅是簡單地調暗畫面，而是真正理解了“夜晚”、“燈光”、“下雨”這些概念，并合乎物理邏輯地對整個畫面進行了重新渲染。
最后，我也試了一下它的風格切換能力。這次就拿《Panty&Stocking》里的畫面做例子：

（圖源：X）
提示詞：
Convert this scene into a photorealistic movie still from a 1990s live-action film, directed by Wong Kar-wai.

（圖源：Gemini）
很有意思，它不僅做到了“三次元化”，還微妙地捕捉到了王家衛電影那種獨特的色彩、光影和氛圍感。
這種跨越媒介和導演風格的無縫切換，為藝術創作提供了更多可能。
不算完美，卻堪稱圖片AIGC新標桿
不可否認，Gemini 2.5 Flash Image的發布，標志著AI在圖像生成領域實現了重大突破。
就像我展示的那樣，曾經需要專業人士花費數小時在PS里用蒙版、圖層、筆刷精雕細琢的工作，如今只需一句自然語言就能瞬間完成，甚至修圖效果比我這種半吊子還要好上不少，屬實有點慚愧。
目前該模型在預覽階段，并非完美無瑕。
在處理極其復雜的、包含大量人物的場景時，Gemini偶爾還是會出現輕微的邏輯錯誤或細節失真。對于一些過于抽象或違反物理常識的指令，它的理解能力也還有提升空間。
不管怎么說，Gemini 2.5 Flash Image算是為AI圖片生成應用樹立了一個新的標桿。
可以預見的是，隨著技術的不斷成熟和成本的降低，未來手機、電腦的相冊和編輯器都可能會原生集成這項功能，就像AI消除、AI擴圖那樣走進尋常百姓家。無論是專業設計師還是普通用戶，每個人都有機會輕松上手，將自己腦海中的創意和對美的理解，更直觀、更高效地展現出來。
修圖有手就行？或許真的不是夢。

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

2025年流星雨迎來謝幕演出小熊座流星雨22日極大

鴻蒙正奔騰！解碼中國自主操作系統的生態成熟好用的極限突圍

我國成功發射通信技術試驗衛星二十三號

寶馬3系全球產量突破1800萬輛，50年傳奇仍在繼續

給AI一雙眼睛：XR眼鏡正在重塑下一代智能終端

摩爾線程技術路線圖全面公開！刷新國產GPU推理天花板，新架構能效飆10倍

全站最新

2025年流星雨迎來謝幕演出小熊座流星雨22日極大

鴻蒙正奔騰！解碼中國自主操作系統的生態成熟好用的極限突圍

我國成功發射通信技術試驗衛星二十三號

寶馬3系全球產量突破1800萬輛，50年傳奇仍在繼續

熱門推薦

上饒農商行被罰240萬，上饒銀行被罰170萬

2025年流星雨迎來謝幕演出小熊座流星雨22日極大

雷軍轉發！小米汽車又獲獎再引發輿論安全追問

鴻蒙正奔騰！解碼中國自主操作系統的生態成熟好用的極限突圍

我國成功發射通信技術試驗衛星二十三號

寶馬3系全球產量突破1800萬輛，50年傳奇仍在繼續

降息，突發！集體拉升，近8萬人爆倉！

給AI一雙眼睛：XR眼鏡正在重塑下一代智能終端

摩爾線程技術路線圖全面公開！刷新國產GPU推理天花板，新架構能效飆10倍

中科大造出首個紫外光譜成像芯片，成本有望直降99%

將RNA的自毀密碼寫入塑料：科學家實現高分子材料的可編程降解

摩爾線程重磅發布：新一代GPU架構“花港”能效提升10倍，系列芯片明年量產上市，推出AI算力筆記本

長安汽車獲得首塊L3級自動駕駛專用正式號牌

供應鏈金融助力發展！2025大宗商品國際化發展大會平行活動舉行

中國網絡空間安全協會盧衛：AI治理應分類，嚴管高風險場景