10月15日消息, 視頻生成模型百度蒸汽機(文心專精)再次升級,行業首次實現AI長視頻實時交互生成。該功能升級依托流式視頻技術實現“無限時長”生成,突破傳統AI視頻生成10秒左右的時長限制,生成速度超越國內主流視頻生成模型。

據悉,用戶只需上傳單張圖片與一段提示詞即可啟動視頻生成流程,并能實時預覽模型推理全部內容。在生成過程中,用戶可隨時暫停、或在任意節點修改提示詞,實現對視頻劇情、畫面、轉場的實時控制,全程干預。這意味著,AI視頻從“單向生成”邁向“雙向共創”,真正實現“無限畫布”式的連續創作體驗。

此外,此次升級同步推出了可交互數字人與開放世界動態構建兩大功能。數字人支持沉浸式雙向互動,可應用于AI導購、教育、陪伴等場景;開放世界則允許用戶通過自行操控,在AI生成的游戲地圖、旅游景點、宇宙空間等環境中自由探索。

據悉,百度蒸汽機自5月以來持續迭代,先后實現音視頻一體化生成、多人對話生成、移動端適配等能力。本次長視頻實時交互功能的推出,進一步拓展了AI視頻在影視預演、互動娛樂、個性化營銷等場景的應用邊界,推動AIGC從“素材生成工具”向“內容共創平臺”演進。(果青)





京公網安備 11011402013531號