IT之家 12 月 1 日消息,可靈 AI 今晚通過(guò)官方公眾號(hào)宣布,全球首個(gè)統(tǒng)一多模態(tài)視頻模型 —— 可靈視頻 O1 模型全量上線。
IT之家從官方介紹獲悉,可靈 O1 模型構(gòu)建了全新生成式底座,從而能夠“打破功能割裂”,并引入 MVL(多模態(tài)視覺(jué)語(yǔ)言)交互架構(gòu),可在單一輸入框內(nèi)無(wú)縫融合多種任務(wù)。結(jié)合 Chain-of-thought 技術(shù),模型從而具備強(qiáng)大的常識(shí)推理與事件推演能力。
官方更稱,依托統(tǒng)一模型的深層語(yǔ)義理解力,“每一張照片、每一個(gè)視頻、每一段文字,在可靈 O1 眼中皆是指令”。同時(shí)上線的還有全新創(chuàng)作界面,僅需簡(jiǎn)單對(duì)話,輕松使用各種素材,精準(zhǔn)生成每一處細(xì)節(jié)。
其支持多視角構(gòu)建主體,號(hào)稱無(wú)論鏡頭如何流轉(zhuǎn),主體特征都能穩(wěn)定如一,確保畫面精準(zhǔn)、連貫。同時(shí),其支持自由組合多個(gè)主體。








京公網(wǎng)安備 11011402013531號(hào)