![]()
智東西
作者 陳駿達
編輯 漠影
這一多模態AI創意工具,迎來多項重磅升級!
智東西11月6日報道,近日,昆侖萬維旗下的多模態創意工具平臺SkyReels迎來一波集中升級,其中最大的亮點就是,他們用一張“無限畫布”,取代了復雜的創作交互方式。
在新版SkyReels上,無論是圖片、視頻生成還是數字人,每一種內容的生成、編輯與組合都可以在同一張“無限畫布”上完成,并且通過簡單拖拽即可實現多模態內容的自由創作。
![]()
這些新功能并非孤立存在,而是相互聯動、形成層次分明的解決方案。SkyReels根據用戶不同的工具使用能力,提供了三種創作路徑:
熟悉AI工具的用戶可以直接使用AI模型生成圖片、視頻、音頻或數字人內容;希望更高效創作的用戶,則可依托近30款聚焦特定場景的Expert Agent,快速完成生成;而對沒有創作經驗的小白用戶,只需套用智能模板,通過簡單的文字描述和畫面替換,即可輕松復刻參考內容。
在此基礎上,SkyReels還推出了Agentic Copilot模式——集Super Agent與Expert Agents于一體的“雙核驅動”體系。用戶可以通過自然語言、上傳素材或提供鏈接,讓AI理解并生成跨模態的創意內容。我們還用這一功能,復刻了Vlog之父Casey Neistat的拍攝風格。
無論是捕捉靈感瞬間,還是規劃完整的創作流程,Agent都能提供智能輔助,讓復雜的創作變得輕松、高效。
智東西對SkyReels近期的升級進行了全面體驗。可以說,這一升級后的創作平臺,不僅在功能上提供了便利,更在整體體驗上實現了統一與流暢。無限畫布、智能Agent等要素的結合,讓用戶能夠在一個簡潔直觀的平臺上,實現海量創意的可能。
一、一張無限畫布,如何統一AI多模態創作?
如今的多模態AI創作平臺看起來五花八門、功能強大,但用起來卻常常讓人頭大。界面層層疊疊,操作邏輯又有點反直覺,更麻煩的是,不同功能之間(比如生圖、生視頻、生音頻)等往往處在不同的界面,甚至是不同的網站,毫無連貫感。
例如,谷歌推出的AI視頻創作工具Flow僅支持文本轉視頻、幀轉視頻和素材轉視頻,如果想用谷歌的Gemini 2.5 Flash生成圖像,并用于創作,還需切換到谷歌的其他AI工具。
![]()
對創作者來說,這種割裂的體驗打斷了創作靈感,也拉高了AI工具的學習成本。AI本該讓創作更輕松、更有趣,但現在的門檻反而擋住了許多好點子。
那么,一個真正以創作者為中心、能夠打通多模態的AI創作平臺,應該是什么樣的?
SkyReels給出的答案,就是一張“無限畫布”。
打開新版SkyReels,占據視覺中心的并非密集的功能面板,而是承載創作素材的畫布。這讓用戶的注意力和操作重心始終在創作本身,而不是被復雜的菜單和參數所干擾。
![]()
所有AI功能與模型都被整合到畫布的側邊欄,既有昆侖萬維自家的多款模型,也覆蓋了當前業內的幾乎所有主流模型。在這片空間中,用戶可以自由地上傳圖像、音頻、視頻等多模態內容,文生圖生成的素材可以成為圖像編輯、圖生視頻的起點。
這種設計符合用戶長期形成的心智模型。Photoshop以畫布為中心,工具和功能區被放在側邊欄或頂部菜單,用戶直接在畫布上操作圖像、繪制、編輯。AE同樣以畫布為視覺核心,所有特效、素材、合成操作在畫布上直觀呈現,工具界面相對輔助。
在繼承經典創作軟件的界面邏輯、降低用戶學習門檻的同時,SkyReels也對多模態創作流程進行了創新整合,讓創作在圖像、視頻、音頻之間自由流動。
在無限畫布上,用戶主要以三種方式進行交互與創作:拖拽、對話、二次編輯。
用戶可以一次性上傳多張圖片、多個視頻,并根據創作需求將素材拖拽到對應的功能上。
例如,將靜態圖片拖拽到“視頻生成”功能上后,它便會在畫布原地變為動態視頻。

如果需要讓視頻中的人物說出想要的臺詞,就只需拖動這個視頻到“Avatar(數字人)”功能上,人物就能開口說話。

同時,用戶還能在無限畫布上捕捉并打磨靈感。當聽到令人心動的音樂、看到有啟發性的視頻后,只需將音頻拖入Chat界面,與智能agent對話。Agent能幫助用戶逐步厘清創作需求,并最終生成相應的視覺畫面。
![]()
在獲得初步生成結果后,用戶可以進行二次編輯——包括視頻風格化、延長內容或進行UpScale畫質升級等。這些操作都可在同一界面中完成,無需跳轉或切換。
SkyReels的無限畫布,把復雜的操作和設置都封裝在了簡單的物理動作背后。“我們希望用戶不需要學習AI,而只需要使用AI。”SkyReels團隊這樣強調。
二、Agent深度融入創作,海量模板讓數字營銷更輕松
為了讓創作的流程進一步提效與智能化,SkyReels 還引入了“雙核驅動”的智能創作體系——由Super Agent與Expert Agents共同構成的全能與專業一體化系統。
在內容創作的早期階段,靈感往往稍縱即逝,圖片、文字、視頻都有可能成為創作的起點。Super Agent的設計讓捕捉這種瞬間的創意需求變得更為容易。
在試用中,Super Agent的多模態識別能力表現出色:無論是上傳圖片、輸入文字,還是提供視頻,它都能跨模態快速理解意圖,并給出有針對性的反饋。
知名Vlogger Casey Neistat有“Vlog之父”稱號,其風格啟發了不少創作者。如今,借助Super Agent的能力,普通人也能在SkyReels中復刻Neistat的風格。
我們可以上傳Neistat的Vlog,并輸入指令“按照Casey Neistat的風格幫我打造一只關于小狗的Vlog”。Super Agent系統能根據視頻的內容,并結合公開信息,分析提煉創作風格。
當用戶的指令并不清晰時,Super Agent不會將錯就錯,而是會主動提問,讓用戶輸入所需信息,或是選擇創作方向。
![]()
完全了解用戶需求后,Super Agent才會開始規劃創作流程,幫用戶逐步打造制作計劃、分鏡、生成角色與背景和生成視頻,期間,用戶不用手動切換工具,只需要確認Agent提出的方案或動作,僅在不滿意時才需介入調整。
![]()
SkyReels生成的首個鏡頭如下,無論是清晨的紐約城,還是富有動感的運鏡,都和Neistat的風格有幾分神似。在此基礎上,用戶可以繼續按照計劃生成視頻,最終獲取足夠的創作素材。
更值得一提的是,Super Agent并非單次響應的“問答式工具”,而是一個可以被隨時喚起、持續陪伴的創作伙伴,可以參與到用戶創作的每一個階段。
相比Super Agent的通用創意能力,Expert Agents更像是一個針對垂直行業打造的“專業智囊庫”。目前SkyReels已內置28個專家Expert Agents,覆蓋市場營銷、電商運營、虛擬形象打造和故事創作等領域。
![]()
在我們的體驗中,營銷類Expert Agent尤其值得關注。要使用Expert Agents,用戶本身并不需要是特定領域的“專家”——Expert Agents在每個場景都會給出清晰的指引,用戶按照指引,像做填空題一樣補全產品賣點、目標受眾、所傳遞的情緒、使用場景等關鍵信息后,系統便能生成完整的營銷素材,如海報、宣傳視頻等等。
![]()
▲SkyReels幫助用戶厘清消費電子產品的宣傳視頻拍攝策略
這28個專家Agent均在特定領域經過深度訓練和優化。它們內置了該領域的專業知識庫和成熟的工作流程,能夠理解行業術語和復雜需求,提供具有行業洞察、可執行性強的專業方案。這使非專業用戶也能快速獲得具備可執行性的成品方案,而不必陷入反復調整和試錯。
隨著多Agent的協作機制進一步完善,未來,這些Agent或許將有望組成專業團隊,協作完成更為復雜的任務。
同時,為進一步便利創作,SkyReels還配備了海量創作模板。這些模板同樣主打“簡單好用”,甚至連文字提示詞都無需輸入——用戶只需上傳基本的圖像素材,即可完成替換。
![]()
例如,在服裝外貿電商場景,SkyReels的模板已經覆蓋了不同人種、不同膚色、不同服裝類目,無論是T恤衫、衛衣、夾克還是大衣,都有對應的細分模板。
![]()
替換元素后,新的衛衣款式、品牌Logo能與原模板無縫融合,真正實現了模板效果的“所見即所得”。
智東西批量嘗試了多個不同樣式的模板,其融合效果始終穩定可靠,幾乎沒有割裂感和不自然的觀感。
此類數字營銷工具,讓相關從業者無需耗費大量時間、精力拍攝宣傳素材,也減少了他們學習AI工具的機會成本。從業者可以把精力集中于產品創意與市場策略本身,從而更高效地實現品牌傳播與業務增長目標。
三、底層模型能力集中升級,數字人能實現多人對話了
“無限畫布”、Agent、模板等創作方式的升級背后,是昆侖萬維在視頻生成模型底層能力上的不斷突破。
數字人能力方面,SkyReels V3模型首先在生成長度上實現跨越,能完成數分鐘的數字人畫面生成。借助這一功能,我們甚至可以用自己打造的卡通形象,拍一部新品宣傳廣告片。
SkyReels在生成數字人時,支持32個運鏡組合與鏡頭運動選項,能夠滿足不同敘事和畫面表達需求,使視覺表現更加生動自然。這些特性,讓數字人能勝任更為完整的營銷敘事,提升宣傳效果。
![]()
SkyReels V3還是業內首個支持單鏡頭多人多輪對話的數字人模型。在傳統的數字人生成模型更多僅提供單人對口型和多人同時發聲。SkyReels V3則能精準控制每個角色的說話時機、節奏、肢體語言和角色間的眼神互動,實現自然的多人對話流,甚至還能同步生成真實的環境音。
在創意場景,SkyReels現在還能將視頻的創意延展,或是轉變為特定的風格。
這些能力基于升級的SkyReels V3。其視頻延長不再局限于業內“單鏡頭拉長”的傳統方式,而是基于視頻語義和用戶prompt,智能預測下一個鏡頭的合理延續與場景內容。
SkyReels V3視頻延長支持多種切鏡方式,包括影視拍攝中常用的切入鏡頭、切出鏡頭、反打鏡頭、多角度鏡頭、切離鏡頭等,能生成具備敘事邏輯與視覺連貫性的延展片段,讓鏡頭語言更豐富,畫面更具動感與電影感。
這一能力讓用戶可以從短視頻中自然過渡至更完整的敘事結構,為影視預演、電商視頻延展、UGC 創作等場景提供更高效的生成方式。
而SkyReels V3此次的風格化模型并非簡單的“濾鏡遷移”。它通過對視頻時序一致性、細節保真度與光影邏輯的深度優化,實現了1:1的角色、動作和場景保真。
無論是“辛普森風”、“樂高風”還是“梵高風”,視頻中的細節都能保持一致,讓風格化不再只是“涂層”,而是深度地融合到畫面之中。
與市面上常見的5秒級別LoRA一鍵風格化不同,SkyReels的模型保持了原視頻的動態結構與語義邏輯。這讓風格遷移具備了更強的穩定性和一致性,足以支撐時長更長廣告創意、動畫預演的視覺再創作。
結語:SkyReels升級背后,昆侖萬維的AI全景布局
SkyReels近期的升級,只是昆侖萬維在AI領域的部分探索。昆侖萬維近期披露的財報顯示,其AI布局已經涵蓋大模型、AGI研究、多模態創作平臺、智能音樂與語音、游戲與社交等方向,并開源了Skywork-Reward、Skywork-R1V、UniPic、Matrix-3D 等系列模型,推出了SkyReels、Mureka、linky、StarMaker和DramaWave等多款應用。
這也帶動了其業績的快速增長。昆侖萬維在本財年前三季度的營收已達58億元,同比增長 52%,海外收入占比93%。作為中國AI出海的重要力量之一,昆侖萬維有望持續推動AI技術研發、產品迭代和商業化應用,打造覆蓋研發、創作和內容生態的全方位AI平臺。





京公網安備 11011402013531號