5月13日,火山引擎在FORCE link AI 創(chuàng)新巡展上海站活動(dòng)中,正式發(fā)布了一系列 AI 模型升級(jí)產(chǎn)品,包括豆包?視頻生成模型 Seedance 1.0 lite、豆包 1.5?視覺(jué)深度思考模型以及豆包?音樂(lè)模型,旨在通過(guò)更全面的模型矩陣和更豐富的智能體工具,助力企業(yè)打通從業(yè)務(wù)到智能體的應(yīng)用鏈路,加速智能化轉(zhuǎn)型。

Seedance 1.0 lite:
此次發(fā)布的AI模型升級(jí)中,豆包視頻生成模型系列的新成員——Seedance 1.0 lite尤為引人注目。作為該系列中的小參數(shù)量版本,Seedance 1.0 lite在技術(shù)上實(shí)現(xiàn)了兩大突破:一是影視級(jí)的視頻生成質(zhì)量,二是視頻生成速度的大幅提升,兼顧效果、速度和性價(jià)比。該模型支持文生視頻和圖生視頻兩種生成方式,視頻生成時(shí)長(zhǎng)可選擇5秒或10秒,分辨率提供480P和720P兩種選項(xiàng)。
Seedance 1.0 lite具備更精準(zhǔn)的指令遵循能力,通過(guò)強(qiáng)大的語(yǔ)義理解能力,可以精細(xì)控制人物的外貌氣質(zhì)、衣著風(fēng)格、表情動(dòng)作等細(xì)節(jié)。此外,該模型在多主體動(dòng)作解析、嵌入式文本響應(yīng)、程度副詞和鏡頭切換響應(yīng)等方面也具有顯著優(yōu)勢(shì),能夠生成更加自然、逼真的視頻內(nèi)容。
此外,Seedance 1.0 lite還支持豐富的影視級(jí)運(yùn)鏡技術(shù),包括360度環(huán)繞、航拍、變焦、平移、跟隨、手持等多種鏡頭語(yǔ)言,其生成的視頻具備細(xì)膩高清的基礎(chǔ)畫質(zhì)和影視級(jí)美感。在運(yùn)動(dòng)交互方面,該模型通過(guò)分析動(dòng)作時(shí)序與空間關(guān)系,提升了人物和物體之間自然流暢的交互動(dòng)作,使運(yùn)動(dòng)軌跡和受力反饋更加符合現(xiàn)實(shí)規(guī)律。
Seedance 1.0 lite模型的應(yīng)用范圍廣泛,涵蓋電商廣告、娛樂(lè)特效、影視創(chuàng)作、動(dòng)態(tài)壁紙等多個(gè)領(lǐng)域。例如在電商領(lǐng)域,該模型能夠幫助商家快速生成高質(zhì)量的營(yíng)銷視頻素材,精準(zhǔn)匹配產(chǎn)品展示和活動(dòng)推廣等場(chǎng)景,從而有效降低制作成本和周期。
豆包1.5:
豆包 1.5?視覺(jué)深度思考模型是一款激活參數(shù)僅 20B 的多模態(tài)模型。在 60 個(gè)公開(kāi)評(píng)估基準(zhǔn)中,該模型在 38 個(gè)方面取得了最佳成績(jī)(SOTA),尤其在視頻理解、視覺(jué)推理和 GUI Agent 能力方面表現(xiàn)突出。
在視頻理解方面,豆包 1.5?視覺(jué)深度思考模型采用動(dòng)態(tài)幀率采樣技術(shù),顯著提升了視頻時(shí)序定位的準(zhǔn)確性。結(jié)合向量搜索功能,模型能夠精確識(shí)別視頻中與文本描述相匹配的片段,為視頻內(nèi)容的深入分析和檢索提供了有力支持。
此外,該模型還具備視頻深度思考能力。通過(guò)學(xué)習(xí)數(shù)萬(wàn)億多模態(tài)標(biāo)記數(shù)據(jù),模型積累了豐富的視覺(jué)知識(shí),并結(jié)合強(qiáng)化學(xué)習(xí)技術(shù),顯著增強(qiáng)了視覺(jué)推理能力。例如,在復(fù)雜的圖形推理任務(wù)中,模型能夠自主提出假設(shè)、進(jìn)行推理驗(yàn)證,并在發(fā)現(xiàn)與假設(shè)不符時(shí),不斷反思并提出新的假設(shè),直至得出正確答案。
值得一提的是,豆包 1.5?視覺(jué)深度思考模型還新增了 GUI Agent 功能。憑借其強(qiáng)大的 GUI 定位能力,該模型能夠在 PC 端、端等多種不同環(huán)境中執(zhí)行復(fù)雜的交互任務(wù)。例如,它可對(duì)新開(kāi)發(fā)的 App 功能進(jìn)行自動(dòng)化測(cè)試,目前該功能已在字節(jié)跳動(dòng)多款 App 產(chǎn)品的開(kāi)發(fā)測(cè)試中得到應(yīng)用。
豆包音樂(lè)模型:





京公網(wǎng)安備 11011402013531號(hào)