國產(chǎn)視頻大模型：賦能千行百業(yè)，開啟AI時代視頻創(chuàng)作新篇章！

IP屬地中國·北京 編輯：蘇婉清 ITBEAR 時間：2025-09-06 12:09:44

隨著“人工智能+”戰(zhàn)略在各行業(yè)深入推進(jìn)，作為人工智能技術(shù)前沿突破的大模型正成為產(chǎn)業(yè)升級的核心引擎。在視頻生成領(lǐng)域，國產(chǎn)大模型通過技術(shù)創(chuàng)新與場景落地，正在重塑內(nèi)容創(chuàng)作生態(tài)。近日，快手人工智能團隊負(fù)責(zé)人就視頻大模型的技術(shù)突破與應(yīng)用前景接受了媒體專訪。
“大模型本質(zhì)上是基于海量數(shù)據(jù)與強大算力構(gòu)建的超級神經(jīng)網(wǎng)絡(luò)，堪稱人工智能技術(shù)的‘基礎(chǔ)設(shè)施’。”快手可靈AI事業(yè)部負(fù)責(zé)人蓋坤解釋道，這類模型通過深度學(xué)習(xí)算法從數(shù)據(jù)中提取規(guī)律，形成具備復(fù)雜任務(wù)處理能力的智能系統(tǒng)。根據(jù)應(yīng)用場景差異，大模型已衍生出語言處理、科學(xué)計算、視頻生成等細(xì)分方向，其中視頻大模型因其對時空維度的精準(zhǔn)建模能力，成為內(nèi)容產(chǎn)業(yè)智能化轉(zhuǎn)型的關(guān)鍵工具。
以快手可靈為例，這款專為視頻創(chuàng)作設(shè)計的模型通過算法重構(gòu)內(nèi)容生產(chǎn)流程。創(chuàng)作者無需依賴傳統(tǒng)拍攝設(shè)備，僅需輸入文本描述即可生成符合物理規(guī)律的動態(tài)畫面。蓋坤透露，團隊自主研發(fā)的流匹配算法與高效模型架構(gòu)，使生成內(nèi)容在角色運動軌跡、畫面時空連貫性等方面達(dá)到行業(yè)領(lǐng)先水平。例如在模擬物體墜落場景時，模型能精準(zhǔn)計算重力加速度與空氣阻力對運動軌跡的影響，生成接近真實拍攝的效果。
在商業(yè)化應(yīng)用層面，AI視頻生成技術(shù)已滲透至廣告制作、電商營銷、短劇生產(chǎn)等多個領(lǐng)域。數(shù)據(jù)顯示，采用可靈輔助制作的AIGC短劇，制作周期較傳統(tǒng)方式縮短67%。2025年第二季度，該模型商業(yè)收入突破2.5億元，其中專業(yè)內(nèi)容創(chuàng)作者貢獻(xiàn)占比近七成。更值得關(guān)注的是，在海外創(chuàng)意平臺Freepik的模型評測中，用戶選擇可靈生成視頻的數(shù)量超過其他所有競品總和，印證了中國團隊在場景理解與用戶體驗優(yōu)化方面的技術(shù)優(yōu)勢。
技術(shù)突破的同時，行業(yè)規(guī)范建設(shè)也在同步推進(jìn)。近期發(fā)布的《人工智能全球治理行動計劃》明確提出，要構(gòu)建安全可控的技術(shù)應(yīng)用體系。蓋坤指出，當(dāng)前視頻生成模型仍面臨物理規(guī)律模擬偏差、長視頻內(nèi)容一致性等挑戰(zhàn)，同時需防范深度偽造技術(shù)帶來的版權(quán)糾紛與虛假信息傳播風(fēng)險。“我們正在建立覆蓋數(shù)據(jù)采集、模型訓(xùn)練、內(nèi)容生成全鏈條的治理機制，通過技術(shù)手段與人工審核相結(jié)合的方式，確保生成內(nèi)容符合倫理規(guī)范。”
據(jù)技術(shù)白皮書披露，國內(nèi)視頻大模型研發(fā)團隊已構(gòu)建起包含3000萬組時空數(shù)據(jù)對的訓(xùn)練集，覆蓋人物動作、環(huán)境交互、光影變化等200余種場景類型。這種數(shù)據(jù)積累優(yōu)勢與算法創(chuàng)新能力，正在推動中國從技術(shù)追趕者向規(guī)則制定者轉(zhuǎn)變。隨著5G網(wǎng)絡(luò)普及與算力成本下降，視頻大模型有望在三年內(nèi)實現(xiàn)從專業(yè)創(chuàng)作到全民應(yīng)用的跨越，重新定義數(shù)字內(nèi)容生產(chǎn)范式。

免責(zé)聲明：本網(wǎng)信息來自于互聯(lián)網(wǎng)，目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點。其內(nèi)容真實性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系我們，本站將會在24小時內(nèi)處理完畢。

同類資訊

OpenAI發(fā)布GPT-5.2-Codex：號稱工程實戰(zhàn)能力天花板

第42次南極考察人員登陸后有何重點工作？

國產(chǎn)大模型叩響資本市場大門

iPhone最高立減2000多元，數(shù)百人排隊搶購榴蓮！海南今起封關(guān)，網(wǎng)友已經(jīng)在看機票了……

1秒定位船舶，語音識別率近九成！吳淞海事局自研系統(tǒng)將推動安全監(jiān)管向智能化邁進(jìn)

上海算力綜合指數(shù)連續(xù)多年居全國前列，在用數(shù)據(jù)中心達(dá)136個

全站最新

OpenAI發(fā)布GPT-5.2-Codex：號稱工程實戰(zhàn)能力天花板

第42次南極考察人員登陸后有何重點工作？

國產(chǎn)大模型叩響資本市場大門

iPhone最高立減2000多元，數(shù)百人排隊搶購榴蓮！海南今起封關(guān)，網(wǎng)友已經(jīng)在看機票了……

熱門推薦

OpenAI發(fā)布GPT-5.2-Codex：號稱工程實戰(zhàn)能力天花板

充滿爭議仍獲放行：密歇根州批準(zhǔn)為甲骨文與OpenAI超級數(shù)據(jù)中心供電

會玩！中國科學(xué)家“擼”的這只“貓”，入選2025全球物理學(xué)年度亮點

第42次南極考察人員登陸后有何重點工作？

國產(chǎn)大模型叩響資本市場大門

開放第三方支付蘋果在日調(diào)整規(guī)則

80后億萬富翁出任NASA局長主張與中國太空競爭

iPhone最高立減2000多元，數(shù)百人排隊搶購榴蓮！海南今起封關(guān)，網(wǎng)友已經(jīng)在看機票了……

社評：中國科技進(jìn)步，路透社本不必焦慮

1秒定位船舶，語音識別率近九成！吳淞海事局自研系統(tǒng)將推動安全監(jiān)管向智能化邁進(jìn)

上海算力綜合指數(shù)連續(xù)多年居全國前列，在用數(shù)據(jù)中心達(dá)136個

歐盟“撤回”2035全面電動化

iPhone內(nèi)存用完就壞了？蘋果客服回應(yīng)

盛路通信：公司研發(fā)的微波模塊組件可應(yīng)用于衛(wèi)星通信系統(tǒng)

首創(chuàng)ACE具身研發(fā)范式大曉機器人構(gòu)建具身智能開放新生態(tài)