3 月 20 日消息,今年 2 月階躍星辰開源了兩款 Step 系列多模態大模型 ——Step-Video-T2V 視頻生成模型和 Step-Audio 語音模型,今天階躍星辰繼續開源圖生視頻模型 ——Step-Video-TI2V,一款基于 30B 參數 Step-Video-T2V 訓練的圖生視頻模型,支持生成 102 幀、5 秒、540P 分辨率的視頻,具備運動幅度可控和鏡頭運動可控兩大核心特點,同時天生具備一定的特效生成能力。

階躍星辰稱,和目前已有開源圖生視頻模型相比,Step-Video-TI2V 不僅在參數規模上對該領域的研究提供了更高的上限,其運動幅度可控能力,更是能夠平衡圖生視頻生成結果的動態性和穩定性,為創作者提供更為靈活的選擇。
與此同時,Step-Video-TI2V 已完成與華為昇騰計算平臺的適配,并在魔樂社區(Modelers)上線。
附 Step-Video-TI2V 核心特點如下:
1、運動幅度可控:動態 & 穩定自由切換
Step-Video-TI2V 支持控制視頻的“運動幅度(motion)”,平衡圖生視頻內容的運動性和穩定性。無論是靜態穩定畫面,還是高動態動作場景,都能滿足創作者需求。
2、多種運鏡控制
除了對鏡頭內主體運動的控制,Step-Video-TI2V 支持對多種運鏡的理解,可以對生成視頻中的鏡頭運動進行精準控制,生成大片級運鏡效果。從基本的推拉搖移、升降,到各種復雜的電影級運鏡效果都能駕馭。
3、動漫效果尤佳
Step-Video-TI2V 在動漫類任務上的效果尤其優異,非常貼合動畫創作、短視頻制作等應用場景。
4、支持多尺寸生成
Step-Video-TI2V 支持多種尺寸圖生視頻,無論是橫屏的寬闊視野,豎屏的沉浸體驗,還是方屏的經典復古,都能輕松駕馭。用戶可以根據不同的創作需求和平臺特性,自由選擇圖片尺寸,無需擔心畫面變形或比例失調的問題。
現在,Step-Video-TI2V 模型已正式開源,階躍 AI 網頁版和 App 端均已上線。
此外,Step-Video-TI2V 現在已初步具備一些特效生成能力,未來,階躍星辰還將通過 LoRA 等技術,持續解鎖模型的特效潛力。
模型及技術報告鏈接:
GitHub:
Github-ComfyUI:
技術報告:





京公網安備 11011402013531號