新智元報道
編輯:桃子 定慧
圖片也能開口說話了!昨晚,谷歌Veo 3全新升級,上傳一張照片即可生成音頻和視頻,角色一致性更是達到新高度。
剛剛,AI視頻頂流Veo 3重磅升級。
這一次,只需一張圖即生成音頻+視頻大片,進入谷歌Flow創作平臺即可體驗。
同一個角色,能在多個鏡頭下,保持高度一致性。就連星際迷航類型的科幻片,Veo 3可以一鍵復刻出來。
還有網友直接用Veo 3拍了一部「巨魔之死」的預告短片,音效、人物一致性極其震撼。
Veo 3如此炸裂的效果,如何體驗?
圖片張口說話了
在進行實測后,感嘆Veo3的視頻生成表現力真的令人驚艷。
鋼鐵俠竟然可以開口說話了!看了讓人頭皮發麻。
本次使用的圖片如下,提示詞為「let him talk something」。
生成效果非常驚艷!Veo3生成了兩個版本的視頻。
第一個比較「正經」,是類似變形金剛中擎天柱的風格。
第二個就比較「符合」鋼鐵俠本人的風格。
整體來看,這兩個視頻和初始圖片的一致性非常之高,畫面運鏡也沒有任何不和諧之處。
本次更新需要在Flow平臺下進行,選擇「frames to Video」的選項,就能從一張圖片開始生成視頻。
需要注意的是,在Gemini Veo3入口目前還無法使用該項功能。
可以選擇首幀,并進行調換來設置想要生成視頻的內容。
這里也需要注意,同時選擇首幀和尾幀,是無法使用Veo3的,只能使用Veo2。
值得一提的是,此次更新,加入非常豐富的運鏡功能,比如Dolly in推鏡頭,指的就是攝像機沿軌道向前移動。
這是以上所有運鏡功能的總結,給大家參考。
同時,也用奧特曼做了測試,這次我們只給了圖片,沒有給出任何文本提示,Veo3依然進行完美的配樂和動畫創造。
最后,你可以通過選擇更好的Quality模型,生成質量更高的視頻,但要消耗更多的credits。
Quality消耗的是Fast的5倍,Fast消耗20credits,Quality是100credits。
關于此次更新更多改進,可以查看谷歌官方的更新文檔。
網友實測
Veo 3更新后,網友第一時間開啟了測試。
有人表示,圖像帶音頻的視頻生成,堪稱是AI敘事領域的一大突破,尤其是前后一致的角色。
包括人物角色的表情非常自然,表演也很到位。
還有前段時間,比較火爆的第一視角AI視頻生成,Veo 3基于圖像的生成同樣令人驚艷。
再看這位老人,帶著巨大的笑容說著,「谷歌剛剛更新了Veo 3,而且Veo 3在Flow上速度很快,但他們還沒把它帶到Gemini應用里」。
提示詞:{ "shot": { "composition": "Medium close-up, 85mm lens, shot on ARRI Alexa Mini LF, shallow depth of field, static camera", "camera_motion": "locked off", "frame_rate": "24fps", "film_grain": "light Kodak 250D grain overlay" }, "subject": { "description": "An elderly woman with exaggerated, cartoonish features: enormous toothy grin stretching nearly ear to ear, deep crow’s feet around wide, manic eyes, a long thin neck with pronounced tendons, and wild silver hair pulled back in a loose bun with stray wisps. She wears a bright blue floral blouse with pink hibiscus flowers and small silver hoop earrings.", "wardrobe": "bright blue floral blouse with pink hibiscus print, silver hoop earrings" }, "scene": { "location": "studio backdrop", "time_of_day": "indeterminate, evenly lit", "environment": "smooth gradient background in lavender to mauve tones, minimal distractions" }, "visual_details": { "action": "the woman leans slightly forward toward camera, her enormous grin widening unnaturally, eyes bulging with gleeful intensity as she clasps her bony hands together just below her chin", "props": "none" }, "cinematography": { "lighting": "soft key light slightly overhead, gentle fill to reduce shadows, creating an uncanny hyperreal clarity on her wrinkles and teeth", "tone": "darkly comedic, unsettling" }, "audio": { "ambient": "faint hum of studio lights", "voice": "old, raspy, whispery with a gleeful, creepy lilt" }, "color_palette": "muted pastels with pops of saturated pink and blue, creating an eerie contrast", "dialogue": { "character": "Elderly Woman", "line": "Google just updated Veo3… and Veo3 fast on Flow… but they didn’t bring it yet to the Gemini app… (giggles, then erupts into a raspy, unhinged laugh)", "subtitles": false }}
還有網友上傳一張Midjourney生成的圖片,再交由Veo 3配音+視頻畫面,瞬間定制一款獨特的香奈兒廣告。
就連動畫領域,Veo 3也沒有放過。
參考資料:
https://x.com/venturetwins/status/1942371183644794987
https://x.com/Diesol/status/1942452185259991246
https://x.com/TawohAwa/status/1942547376121725096
https://www.youtube.com/watch?v=-xthML25JOs
![]()



京公網安備 11011402013531號