隨著“人工智能+”戰(zhàn)略在各行業(yè)深入推進(jìn),作為人工智能技術(shù)前沿突破的大模型正成為產(chǎn)業(yè)升級的核心引擎。在視頻生成領(lǐng)域,國產(chǎn)大模型通過技術(shù)創(chuàng)新與場景落地,正在重塑內(nèi)容創(chuàng)作生態(tài)。近日,快手人工智能團隊負(fù)責(zé)人就視頻大模型的技術(shù)突破與應(yīng)用前景接受了媒體專訪。
“大模型本質(zhì)上是基于海量數(shù)據(jù)與強大算力構(gòu)建的超級神經(jīng)網(wǎng)絡(luò),堪稱人工智能技術(shù)的‘基礎(chǔ)設(shè)施’。”快手可靈AI事業(yè)部負(fù)責(zé)人蓋坤解釋道,這類模型通過深度學(xué)習(xí)算法從數(shù)據(jù)中提取規(guī)律,形成具備復(fù)雜任務(wù)處理能力的智能系統(tǒng)。根據(jù)應(yīng)用場景差異,大模型已衍生出語言處理、科學(xué)計算、視頻生成等細(xì)分方向,其中視頻大模型因其對時空維度的精準(zhǔn)建模能力,成為內(nèi)容產(chǎn)業(yè)智能化轉(zhuǎn)型的關(guān)鍵工具。
以快手可靈為例,這款專為視頻創(chuàng)作設(shè)計的模型通過算法重構(gòu)內(nèi)容生產(chǎn)流程。創(chuàng)作者無需依賴傳統(tǒng)拍攝設(shè)備,僅需輸入文本描述即可生成符合物理規(guī)律的動態(tài)畫面。蓋坤透露,團隊自主研發(fā)的流匹配算法與高效模型架構(gòu),使生成內(nèi)容在角色運動軌跡、畫面時空連貫性等方面達(dá)到行業(yè)領(lǐng)先水平。例如在模擬物體墜落場景時,模型能精準(zhǔn)計算重力加速度與空氣阻力對運動軌跡的影響,生成接近真實拍攝的效果。
在商業(yè)化應(yīng)用層面,AI視頻生成技術(shù)已滲透至廣告制作、電商營銷、短劇生產(chǎn)等多個領(lǐng)域。數(shù)據(jù)顯示,采用可靈輔助制作的AIGC短劇,制作周期較傳統(tǒng)方式縮短67%。2025年第二季度,該模型商業(yè)收入突破2.5億元,其中專業(yè)內(nèi)容創(chuàng)作者貢獻(xiàn)占比近七成。更值得關(guān)注的是,在海外創(chuàng)意平臺Freepik的模型評測中,用戶選擇可靈生成視頻的數(shù)量超過其他所有競品總和,印證了中國團隊在場景理解與用戶體驗優(yōu)化方面的技術(shù)優(yōu)勢。
技術(shù)突破的同時,行業(yè)規(guī)范建設(shè)也在同步推進(jìn)。近期發(fā)布的《人工智能全球治理行動計劃》明確提出,要構(gòu)建安全可控的技術(shù)應(yīng)用體系。蓋坤指出,當(dāng)前視頻生成模型仍面臨物理規(guī)律模擬偏差、長視頻內(nèi)容一致性等挑戰(zhàn),同時需防范深度偽造技術(shù)帶來的版權(quán)糾紛與虛假信息傳播風(fēng)險。“我們正在建立覆蓋數(shù)據(jù)采集、模型訓(xùn)練、內(nèi)容生成全鏈條的治理機制,通過技術(shù)手段與人工審核相結(jié)合的方式,確保生成內(nèi)容符合倫理規(guī)范。”
據(jù)技術(shù)白皮書披露,國內(nèi)視頻大模型研發(fā)團隊已構(gòu)建起包含3000萬組時空數(shù)據(jù)對的訓(xùn)練集,覆蓋人物動作、環(huán)境交互、光影變化等200余種場景類型。這種數(shù)據(jù)積累優(yōu)勢與算法創(chuàng)新能力,正在推動中國從技術(shù)追趕者向規(guī)則制定者轉(zhuǎn)變。隨著5G網(wǎng)絡(luò)普及與算力成本下降,視頻大模型有望在三年內(nèi)實現(xiàn)從專業(yè)創(chuàng)作到全民應(yīng)用的跨越,重新定義數(shù)字內(nèi)容生產(chǎn)范式。





京公網(wǎng)安備 11011402013531號