![]()
新智元報道
編輯:編輯部
就在剛剛,字節Seedance 1.5 pro一上線,網友們都玩瘋了!音畫同步、方言直出效果太驚艷,文物直播、熊貓嘮嗑、小扎和馬斯克上演真人角斗,這個模型的升級,將徹底改變未來的AI視頻制作流程。
最近的AI視頻模型大混戰,豆包也下場了!
就在今天,火山引擎在FORCE大會上,正式發布了豆包視頻生成模型Seedance 1.5 pro,生成效果一下子就把我們震到了。
比如,被谷歌折磨得不行的OpenAI CEO奧特曼,痛苦扶額飆出河南方言:
唉呀,最近谷歌咋恁牛咧?發那個模型直接給咱干趴下了!昨天的生圖模型都沒人瞅!
甚至,已經有網紅大V用它做出爆款視頻了。
老祖宗文物們走進直播間里開始孤身搖,一邊還唱著時下最火的熱門歌曲,如此腦洞十足的視頻,眼看著就要在小紅書開始病毒式傳播。
![]()
不用懷疑,這么逼真的效果,背后都來自Seedance 1.5 pro的加持!
沒錯,這次的全方位升級,直接讓它在AI視頻模型中全面領先。
首先,Seedance 1.5 pro可以支持音視頻聯合生成了,不再局限于視覺維度。
其次,模型的視覺沖擊力和運動效果,又一次突破了上限。
多語言的超自然對白、人物情緒與表情細膩的亮點,也讓人印象深刻。
這些升級加起來,讓模型生成的視頻形成了極其強大的影視級敘事張力。
而且,如此絲滑的效果,已經人人可用了,價錢也不貴!
即日起,個人用戶可在豆包APP、即夢AI體驗;企業用戶可在火山方舟體驗中心體驗,自12月23日起火山引擎也會上線該模型API。
![]()
![]()
![]()
Seedance 1.5 pro到底有多強? 別急,讓我們一個一個來拆解。
影視級敘事張力
什么是一個AI視頻的靈魂?
顯然,視覺模型需要做到的不僅是生成高清畫面,還要能駕馭影視級的鏡頭語言、敘事張力,同時還要捕捉轉瞬即逝的微表情。
在這方面,Seedance 1.5 pro此次的增強也相當令人刮目相看。
無論是審訊的女人不屑的表情,還是男人的特寫鏡頭中皺眉、微笑與咽口水等微動作,模型都極強地表現了出來,諜戰大片分分鐘生成。
![]()
在越來越多的實測中,我們驚喜地發現模型具備極其細膩的情緒捕捉能力。
即使沒有臺詞,它也能通過細微的表情變化,來延伸情緒鋪墊。
比如在這個地球被三體殖民的末日世界中,Seedance 1.5 pro根據指令詳細推測出了故事背景,并且極其細致地演繹出了羅輯悲傷壓抑的內心狀態,情緒變化細微而富有層次,呈現出大片的細膩質感。

音畫高精同步
AI視頻的一大難關,就是不僅要「看得見」,更要「聽得真」。
當AI從創作「默片」升級到真正的有聲視頻,生成質量才更經得起現實檢驗。
為此,我們專門設計了一個辦公室場景——職場拍馬屁尷尬現場(延遲反映版)。
首先,老板先自己講了一個明顯不好笑的冷笑話,自己先笑了起來,然后臉上非常期待員工們的表情。
員工們的臉部特寫顯示,空氣中充滿了「即將假笑」的壓迫感。隨后大家的職場假笑同時爆發,留下老板在原地困惑。
可以看出,Seedance 1.5 pro完全做到了視覺和聽覺在時間上的精確同步。
接下來,讓Seedance 1.5 pro幫我們呈現一場扎克伯格和馬斯克在八角籠中的硅谷終極對決。
拳拳到肉的廝殺讓這場角斗驚心動魄。而整個視頻中,無論是兩人還是觀眾,每個聲效跟動作都能完美對上。
多人多語言
助力短劇、喜劇和國風
除了音效的升級之外,這次Seedance 1.5 pro還給了我們一個大驚喜。
以往的AI視頻里,我們常常被「張口無聲」或「閉口說話」的詭異畫面勸退——人物口型和臺詞完全是錯位的。
而現在,這個問題被Seedance 1.5 pro徹底解決了。
準備好,接下來是一大波方言襲擊!
率先登場的是——活力大灣區,魅力新廣州!
熊貓戴著貝雷帽坐在巴黎街角的咖啡館外,跟法國總統及夫人說著四川話,總統夫人笑著用法語回答。
地道的四川話,讓熊貓一張口就令人忍俊不禁。
多人多語言的功能,讓短劇、喜劇、國風的內容創作者都更添了一把利器。
短劇中的角色,可以自然地說著自己的家鄉話;在喜劇中,能夠完美還原方言特有的幽默感和節奏,讓笑點更自然。
在昆曲永恒的國粹經典《牡丹亭》中,Seedance 1.5 pro讓我們得以穿越回到古代,一窺這部與莎翁《羅密歐與朱麗葉》齊名的唯美愛情悲劇。
如此逼真的效果,大V們只要有腦洞,馬上就能產出下一個爆款了!
專業運鏡+動態張力
滿足高難度場景需求
因為Seedance 1.5 pro優化了運鏡控制和動態張力,就能更好地應對高難度的復雜場景生成。
它相對從容地演繹高動態、高沖擊力的運動場景。
在下面這個蹦極視頻中,它演繹出極強的臨場感,真實還原了極限運動的速度與力量。

而模型自發的運鏡調度能力,能夠執行高難度鏡頭運動。
我們讓它來個恐怖片場景。雙胞胎小女孩站在走廊中,隨后鏡頭開始擠壓,各種復雜的運鏡創造出空間的畸變感,恐怖效果拉滿。
產業級場景
在廣告電商等產業級場景,Seedance 1.5 pro也有著廣闊的應用場景。
比如奧特曼舉著一瓶香奈兒No.5,用一口標準的普通話給我們打著廣告。
技術突破
讓默片走向有聲電影
值得一提的是,Seedance 1.5 pro的技術論文也已于近日公開,讓我們得以一窺這個強大的模型背后的奧秘與巧思。
![]()
論文地址:https://arxiv.org/pdf/2512.13507
長久以來,AI視頻生成領域都在上演著令人尷尬的「獨角戲」:AI生成的畫面流光溢彩,卻往往伴隨著死一般的寂靜,或是被后期硬貼上并不合拍的音效。
這種割裂感,讓AI視頻始終像是一個精美的玻璃標本——好看,但沒有生命。
Seedance 1.5 pro的出現,是一次從「默片時代」向「有聲電影」的大跨越。
它拋棄了業內慣用的「先生成視頻、再匹配音頻」的級聯式老路,轉而采用原生音視聯合生成(Native Audio-Visual Joint Generation)架構。
在它的「大腦」——雙分支擴散Transformer(MMDiT)中,像素的光影與聲波的震動被視為同一數據的兩面。
![]()
這意味著,當它構思一只玻璃杯落地時,碎裂的清脆聲響并非后期合成,而是與玻璃觸地的畫面在毫秒間同步誕生的。
這種底層邏輯的重構,帶來了對競品的降維打擊。
因此,Seedance 1.5 pro在音頻能力上成為市面上所有模型中唯一的八邊形戰士,定義了頂尖模型新基準。
![]()
Seedance 1.5 pro的亮點,不只有極致的音畫同步,和更懂「中國味」。
因為依托多階段蒸餾技術,模型的推理速度暴漲10倍,這就意味著它不再是只有頂級顯卡才能供養的昂貴玩具,而是真正能下沉到短劇制作、廣告創意一線的生產力工具,從實驗室走向工業界。
如果說Sora 2展示了AI對物理世界的視覺想象力,那么Seedance 1.5 pro則賦予了AI傾聽與表達的感官通感。
One More Thing
最后,Seedance 1.5 pro即將上線的Draft樣片功能,也是讓人非常期待。
這個功能,能讓我們在抽盲盒階段,就輸出較低分辨率的視頻,鎖定關鍵元素,如果確認沒問題,才會給你高清成片。
一下子,模型推理成本直接就節約了最高60%,性價比超高。
![]()
![]()
上:Draft 480p;下:滿血1080p
(視頻截圖)

上:Draft 480p;下:滿血1080p
(動圖節選)
雖然強敵環伺、競爭升級,但Seedance 1.5 pro,依然穩穩站在浪潮前端。
因為,它真正做到了聲畫交融、彼此成全,畫面、音效和情緒節奏都能融為一體,直接輸出影視級成品。
從此,AI視頻不再只是「會動的畫面+背景音」,而是直接可進入剪輯流程的素材。
未來的視頻制作中,聲音設計可以從開頭就介入構思。
一場AI視頻的風暴已經掀起,我們也無比期待,它掀起的另一個浪頭。
參考資料:
秒追ASI
?點贊、轉發、在看一鍵三連?
點亮星標,鎖定新智元極速推送!





京公網安備 11011402013531號