12月17日,谷歌公司宣布推出新一代視頻生成模型Veo 2,該模型在理解和呈現(xiàn)現(xiàn)實(shí)世界物理現(xiàn)象、人類(lèi)運(yùn)動(dòng)及表情細(xì)節(jié)方面取得重大突破,整體視頻質(zhì)量得到顯著提升。

Veo 2模型具備生成4K(4096 x 2160像素)分辨率、2分鐘時(shí)長(zhǎng)的視頻能力。相較于OpenAI的Sora模型,Veo 2在分辨率和時(shí)長(zhǎng)方面分別提升了4倍和6倍。盡管Veo 2具有強(qiáng)大功能,但在Google的實(shí)驗(yàn)性視頻創(chuàng)建工具VideoFX中,其分辨率上限為720p,時(shí)長(zhǎng)限制為8秒。
Veo 2能夠根據(jù)文本提示或文本和參考圖像生成視頻,更真實(shí)地模擬運(yùn)動(dòng)、流體動(dòng)力學(xué)和光的屬性,為視頻創(chuàng)作帶來(lái)更多可能性。此外,為防止濫用,Google采用專(zhuān)有水印技術(shù)SynthID,將隱形標(biāo)記嵌入Veo 2生成的視頻幀中,以識(shí)別AI生成的內(nèi)容。
DeepMind產(chǎn)品副總裁Eli Collins透露,未來(lái)幾個(gè)月內(nèi),團(tuán)隊(duì)將根據(jù)用戶(hù)反饋,對(duì)Veo 2模型進(jìn)行持續(xù)優(yōu)化和迭代。目前,Veo 2模型僅對(duì)部分用戶(hù)開(kāi)放。在此期間,原始的Veo模型仍可在Vertex AI平臺(tái)上使用。Google表示,盡管Veo 2在減少錯(cuò)誤方面有所改進(jìn),但仍有待進(jìn)一步完善。





京公網(wǎng)安備 11011402013531號(hào)