近日, 阿里巴巴宣布開源其全能型視頻生成與編輯模型“通義萬相 Wan2.1-VACE”。該模型功能全面,單一模型即可支持文生視頻、圖像參考視頻生成、視頻重繪、視頻局部編輯、視頻背景延展以及視頻時長延展等全系列基礎生成和編輯能力,號稱目前業界功能最全面的視頻生成與編輯模型之一。

通義萬相 Wan2.1-VACE 的核心優勢在于其強大的多功能性,它能夠根據文字描述生成視頻,也能基于靜態圖像生成動態視頻。此外,該模型還支持對現有視頻進行重繪,提升畫面質量,并能對視頻中的特定區域進行局部編輯。值得一提的是,它可以擴展視頻背景,增加場景的深度和廣度,還能延長視頻的播放時間,使內容更加豐富。這些功能覆蓋了視頻創作從生成到編輯的各個環節,為創作者提供了極大的便利。
此次阿里巴巴此次開源了兩個版本:1.3B 和 14B。其中,1.3B 版本針對消費級進行了優化,使得普通用戶也能輕松運行。而 14B 版本則擁有更強大的性能,適合對計算資源要求較高的專業場景。
據悉,通義萬相是阿里巴巴通義系列 AI 繪畫創作大模型的一部分,最初于 2023 年 7 月 7 日上線,主要用于輔助圖片創作。2024 年 9 月 19 日的阿里云棲大會上,通義萬相視頻生成大模型正式發布,標志著其正式進軍視頻生成領域。該模型不僅能夠生成影視級高清視頻,還具備較強的中文理解能力,能夠更好地理解中文指令。
通義萬相視頻生成模型在今年 1 月初升級至 2.1 版,在處理復雜運動、還原真實物理規律、提升電影質感及優化指令遵循方面取得了顯著進展。2 月 25 日,阿里巴巴宣布全面開源萬相 2.1 模型,進一步推動了該模型的應用與普及。





京公網安備 11011402013531號