12月3日,騰訊混元大模型宣布正式上線視頻生成能力。騰訊方面表示,騰訊開源該視頻生成大模型參數(shù)量達(dá)到130億,是當(dāng)前最大的視頻開源模型。
“用戶只需要輸入一段描述,即可生成視頻,”騰訊混元相關(guān)負(fù)責(zé)人透露,目前生成視頻支持中英文雙語輸入、多種視頻尺寸以及多種視頻清晰度。目前該模型已上線騰訊元寶APP,用戶可在AI應(yīng)用中的“AI視頻”板塊申請?jiān)囉谩F髽I(yè)客戶通過騰訊云提供服務(wù)接入,目前API同步開放內(nèi)測申請。

通過騰訊元寶APP-AI應(yīng)用-AI視頻即可使用該功能(前期需申請)
騰訊方面 表示,在與國內(nèi)外多個頂尖模型的評測對比顯示,混元視頻生成模型在文本視頻一致性、運(yùn)動質(zhì)量和畫面質(zhì)量多個維度效果領(lǐng)先,在人物、人造場所等場景下表現(xiàn)尤為出色。
據(jù)悉,騰訊混元生成視頻大模型可以實(shí)現(xiàn)超寫實(shí)畫質(zhì)、生成高度符合提示詞的視頻畫面,畫面流暢不易變形。比如,在沖浪、跳舞等大幅度運(yùn)動畫面的生成中,騰訊混元可以生成非常流暢、合理的運(yùn)動鏡頭,物體不易出現(xiàn)變形;光影反射基本符合物理規(guī)律,在鏡面或者照鏡子場景中,可以做到鏡面內(nèi)外動作一致。同時(shí),模型還可以實(shí)現(xiàn)在畫面主角保持不變的情況下自動切換鏡頭,這是業(yè)界大部分模型所不具備的能力。

視頻由騰訊混元視頻生成,提示詞:超大海浪,沖浪者在浪花上起跳,完成空中轉(zhuǎn)體。攝影機(jī)從海浪內(nèi)部穿越而出,捕捉陽光透過海水的瞬間。水花在空中形成完美弧線,沖浪板劃過水面留下軌跡。最后定格在沖浪者穿越水簾的完美瞬間。

視頻由騰訊混元視頻生成,提示詞:一位中國美女穿著漢服,頭發(fā)飄揚(yáng),背景是倫敦,然后鏡頭切換到特寫鏡頭。
目前,騰訊宣布開源該視頻生成大模型已在 Hugging Face 平臺及 Github 上發(fā)布,包含模型權(quán)重、推理代碼、模型算法等完整模型,可供企業(yè)與個人開發(fā)者免費(fèi)使用和開發(fā)生態(tài)插件。基于騰訊混元的開源模型,開發(fā)者及企業(yè)無需從頭訓(xùn)練,即可直接用于推理,并可基于騰訊混元系列打造專屬應(yīng)用及服務(wù),能夠節(jié)約大量人力及算力,加速行業(yè)創(chuàng)新步伐。
據(jù)南方+記者了解到,此前騰訊混元已經(jīng)開源了旗下文生文、文生圖和3D生成大模型。至此,騰訊混元系列大模型已實(shí)現(xiàn)全面開源。
南方+記者 葉丹
葉丹
南方報(bào)業(yè)傳媒集團(tuán)南方+客戶端





京公網(wǎng)安備 11011402013531號