奧特曼飆河南話，小扎馬斯克真人約架！豆包新模型把AI視頻玩成「活人」

IP屬地中國·北京 新智元 時間：2025-12-18 22:16:19

新智元報道
編輯：編輯部
就在剛剛，字節Seedance 1.5 pro一上線，網友們都玩瘋了！音畫同步、方言直出效果太驚艷，文物直播、熊貓嘮嗑、小扎和馬斯克上演真人角斗，這個模型的升級，將徹底改變未來的AI視頻制作流程。
最近的AI視頻模型大混戰，豆包也下場了！
就在今天，火山引擎在FORCE大會上，正式發布了豆包視頻生成模型Seedance 1.5 pro，生成效果一下子就把我們震到了。
比如，被谷歌折磨得不行的OpenAI CEO奧特曼，痛苦扶額飆出河南方言：
唉呀，最近谷歌咋恁牛咧？發那個模型直接給咱干趴下了！昨天的生圖模型都沒人瞅！
甚至，已經有網紅大V用它做出爆款視頻了。
老祖宗文物們走進直播間里開始孤身搖，一邊還唱著時下最火的熱門歌曲，如此腦洞十足的視頻，眼看著就要在小紅書開始病毒式傳播。

不用懷疑，這么逼真的效果，背后都來自Seedance 1.5 pro的加持！
沒錯，這次的全方位升級，直接讓它在AI視頻模型中全面領先。
首先，Seedance 1.5 pro可以支持音視頻聯合生成了，不再局限于視覺維度。
其次，模型的視覺沖擊力和運動效果，又一次突破了上限。
多語言的超自然對白、人物情緒與表情細膩的亮點，也讓人印象深刻。
這些升級加起來，讓模型生成的視頻形成了極其強大的影視級敘事張力。
而且，如此絲滑的效果，已經人人可用了，價錢也不貴！
即日起，個人用戶可在豆包APP、即夢AI體驗；企業用戶可在火山方舟體驗中心體驗，自12月23日起火山引擎也會上線該模型API。

Seedance 1.5 pro到底有多強？別急，讓我們一個一個來拆解。
影視級敘事張力
什么是一個AI視頻的靈魂？
顯然，視覺模型需要做到的不僅是生成高清畫面，還要能駕馭影視級的鏡頭語言、敘事張力，同時還要捕捉轉瞬即逝的微表情。
在這方面，Seedance 1.5 pro此次的增強也相當令人刮目相看。
無論是審訊的女人不屑的表情，還是男人的特寫鏡頭中皺眉、微笑與咽口水等微動作，模型都極強地表現了出來，諜戰大片分分鐘生成。

在越來越多的實測中，我們驚喜地發現模型具備極其細膩的情緒捕捉能力。
即使沒有臺詞，它也能通過細微的表情變化，來延伸情緒鋪墊。
比如在這個地球被三體殖民的末日世界中，Seedance 1.5 pro根據指令詳細推測出了故事背景，并且極其細致地演繹出了羅輯悲傷壓抑的內心狀態，情緒變化細微而富有層次，呈現出大片的細膩質感。

音畫高精同步
AI視頻的一大難關，就是不僅要「看得見」，更要「聽得真」。
當AI從創作「默片」升級到真正的有聲視頻，生成質量才更經得起現實檢驗。
為此，我們專門設計了一個辦公室場景——職場拍馬屁尷尬現場（延遲反映版）。
首先，老板先自己講了一個明顯不好笑的冷笑話，自己先笑了起來，然后臉上非常期待員工們的表情。
員工們的臉部特寫顯示，空氣中充滿了「即將假笑」的壓迫感。隨后大家的職場假笑同時爆發，留下老板在原地困惑。
可以看出，Seedance 1.5 pro完全做到了視覺和聽覺在時間上的精確同步。
接下來，讓Seedance 1.5 pro幫我們呈現一場扎克伯格和馬斯克在八角籠中的硅谷終極對決。
拳拳到肉的廝殺讓這場角斗驚心動魄。而整個視頻中，無論是兩人還是觀眾，每個聲效跟動作都能完美對上。
多人多語言
助力短劇、喜劇和國風
除了音效的升級之外，這次Seedance 1.5 pro還給了我們一個大驚喜。
以往的AI視頻里，我們常常被「張口無聲」或「閉口說話」的詭異畫面勸退——人物口型和臺詞完全是錯位的。
而現在，這個問題被Seedance 1.5 pro徹底解決了。
準備好，接下來是一大波方言襲擊！
率先登場的是——活力大灣區，魅力新廣州！
熊貓戴著貝雷帽坐在巴黎街角的咖啡館外，跟法國總統及夫人說著四川話，總統夫人笑著用法語回答。
地道的四川話，讓熊貓一張口就令人忍俊不禁。
多人多語言的功能，讓短劇、喜劇、國風的內容創作者都更添了一把利器。
短劇中的角色，可以自然地說著自己的家鄉話；在喜劇中，能夠完美還原方言特有的幽默感和節奏，讓笑點更自然。
在昆曲永恒的國粹經典《牡丹亭》中，Seedance 1.5 pro讓我們得以穿越回到古代，一窺這部與莎翁《羅密歐與朱麗葉》齊名的唯美愛情悲劇。
如此逼真的效果，大V們只要有腦洞，馬上就能產出下一個爆款了！
專業運鏡+動態張力
滿足高難度場景需求
因為Seedance 1.5 pro優化了運鏡控制和動態張力，就能更好地應對高難度的復雜場景生成。
它相對從容地演繹高動態、高沖擊力的運動場景。
在下面這個蹦極視頻中，它演繹出極強的臨場感，真實還原了極限運動的速度與力量。

而模型自發的運鏡調度能力，能夠執行高難度鏡頭運動。
我們讓它來個恐怖片場景。雙胞胎小女孩站在走廊中，隨后鏡頭開始擠壓，各種復雜的運鏡創造出空間的畸變感，恐怖效果拉滿。
產業級場景
在廣告電商等產業級場景，Seedance 1.5 pro也有著廣闊的應用場景。
比如奧特曼舉著一瓶香奈兒No.5，用一口標準的普通話給我們打著廣告。
技術突破
讓默片走向有聲電影
值得一提的是，Seedance 1.5 pro的技術論文也已于近日公開，讓我們得以一窺這個強大的模型背后的奧秘與巧思。

論文地址：https://arxiv.org/pdf/2512.13507
長久以來，AI視頻生成領域都在上演著令人尷尬的「獨角戲」：AI生成的畫面流光溢彩，卻往往伴隨著死一般的寂靜，或是被后期硬貼上并不合拍的音效。
這種割裂感，讓AI視頻始終像是一個精美的玻璃標本——好看，但沒有生命。
Seedance 1.5 pro的出現，是一次從「默片時代」向「有聲電影」的大跨越。
它拋棄了業內慣用的「先生成視頻、再匹配音頻」的級聯式老路，轉而采用原生音視聯合生成（Native Audio-Visual Joint Generation）架構。
在它的「大腦」——雙分支擴散Transformer（MMDiT）中，像素的光影與聲波的震動被視為同一數據的兩面。

這意味著，當它構思一只玻璃杯落地時，碎裂的清脆聲響并非后期合成，而是與玻璃觸地的畫面在毫秒間同步誕生的。
這種底層邏輯的重構，帶來了對競品的降維打擊。
因此，Seedance 1.5 pro在音頻能力上成為市面上所有模型中唯一的八邊形戰士，定義了頂尖模型新基準。

Seedance 1.5 pro的亮點，不只有極致的音畫同步，和更懂「中國味」。
因為依托多階段蒸餾技術，模型的推理速度暴漲10倍，這就意味著它不再是只有頂級顯卡才能供養的昂貴玩具，而是真正能下沉到短劇制作、廣告創意一線的生產力工具，從實驗室走向工業界。
如果說Sora 2展示了AI對物理世界的視覺想象力，那么Seedance 1.5 pro則賦予了AI傾聽與表達的感官通感。
One More Thing
最后，Seedance 1.5 pro即將上線的Draft樣片功能，也是讓人非常期待。
這個功能，能讓我們在抽盲盒階段，就輸出較低分辨率的視頻，鎖定關鍵元素，如果確認沒問題，才會給你高清成片。
一下子，模型推理成本直接就節約了最高60%，性價比超高。

上：Draft 480p；下：滿血1080p
（視頻截圖）

上：Draft 480p；下：滿血1080p
（動圖節選）
雖然強敵環伺、競爭升級，但Seedance 1.5 pro，依然穩穩站在浪潮前端。
因為，它真正做到了聲畫交融、彼此成全，畫面、音效和情緒節奏都能融為一體，直接輸出影視級成品。
從此，AI視頻不再只是「會動的畫面+背景音」，而是直接可進入剪輯流程的素材。
未來的視頻制作中，聲音設計可以從開頭就介入構思。
一場AI視頻的風暴已經掀起，我們也無比期待，它掀起的另一個浪頭。
參考資料：
秒追ASI
?點贊、轉發、在看一鍵三連?
點亮星標，鎖定新智元極速推送！

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

TikTok簽署協議，將美國業務出售給甲骨文等主導的合資企業

谷歌安卓16調整Emoji表情設計，風格向iOS靠攏

周受資內部信曝TikTok美國方案；騰訊辟謠元寶由真人運營丨邦早報

TikTok美國業務新進展：字節保留電商、廣告等，引入三方組新合資公司負責數據安全

AI浪潮下，10年后的頂尖高校拼什么？丨GAIR 2025

極數迭代CEO佟顯喬：具身智能的數據工程解決方案思考丨GAIR 2025

全站最新

TikTok簽署協議，將美國業務出售給甲骨文等主導的合資企業

谷歌安卓16調整Emoji表情設計，風格向iOS靠攏

周受資內部信曝TikTok美國方案；騰訊辟謠元寶由真人運營丨邦早報

TikTok美國業務新進展：字節保留電商、廣告等，引入三方組新合資公司負責數據安全

熱門推薦

授權亂象頻出，誰的同仁堂？

當“野性消費”退潮：鴻星爾克留下了什么？

英氏控股的優勢只有品牌和廣告嗎？

為什么蘋果、華為，都干不過小天才？

豪擲10億美金投資OpenAI！迪士尼終于對AI妥協了？（深度觀察）

從“寧王”到“易中天”，時代的“魚群”在遷徙

阿維塔赴港IPO：一場針對“依附者”的價值審視

“鐵飯碗”銀行也開始末位淘汰了？普通人有機會，但沒退路

君樂寶，想要逃出伊利、蒙牛的“五指山”

5 個月估值翻 3 倍！瑞典 AI 巨頭 Lovable 獲 3.3 億美元 B 輪融資

十億流量瞬間清零!YouTube 永久封禁兩大 AI 虛假預告片“鼻祖”頻道

OpenAI 更新 ChatGPT 以強化未成年人保護措施

告別信息淹沒！ChatGPT 推出聊天置頂功能，讓重要對話觸手可及

Meta 官宣2026上半年發布 Mango 系列下一代模型

ChatGPT 移動應用全球用戶支出突破 30 億美元