百度慧播星發(fā)布新一代NOVA數(shù)字人
還記得今年618期間,羅永浩的數(shù)字人直播首秀一度掀起了全網(wǎng)討論熱潮。
當(dāng)時(shí),出現(xiàn)在百度直播間里的“羅永浩”和搭檔“朱蕭木”,被不少觀眾以為是真人,想方設(shè)法找出“破綻”。
可以說,無論是身形、樣貌、聲音,還是實(shí)時(shí)互動(dòng)的能力,羅永浩數(shù)字人的表現(xiàn)幾乎都與真人無異。
更加出人意料的是,這場(chǎng)6個(gè)小時(shí)的數(shù)字人直播,最終吸引了超過1300萬人次觀看,GMV突破5500萬元,甚至在部分3C、食品等核心品類方面,數(shù)字人帶貨單量比此前羅永浩的真人直播成績(jī)還要好。
如此亮眼的效果和成績(jī),很快就讓羅永浩數(shù)字人直播吸引了業(yè)內(nèi)的高度關(guān)注、媒體的爭(zhēng)相報(bào)道,比如海外的權(quán)威媒體CNBC更是評(píng)價(jià)稱:“這是中國(guó)與數(shù)字人行業(yè)的DeepSeek時(shí)刻”。
毫無疑問,對(duì)于直播電商行業(yè)而言,羅永浩的數(shù)字人直播可謂是一場(chǎng)里程碑事件,標(biāo)志著數(shù)字人技術(shù)已經(jīng)高度成熟,并在落地應(yīng)用的過程中展現(xiàn)出了媲美真人、超越真人的效果。
當(dāng)然,技術(shù)的突破是一方面,讓很多從業(yè)者更加關(guān)心的是,羅永浩數(shù)字人直播的效果能否被復(fù)制?中小體量的直播間能否享受到最新技術(shù)釋放的紅利?
對(duì)此,為羅永浩數(shù)字人直播提供技術(shù)支持的百度慧播星數(shù)字人平臺(tái)給出了答案。
7月26日的世界人工智能大會(huì)現(xiàn)場(chǎng),百度慧播星發(fā)布了新一代數(shù)字人技術(shù)“NOVA”,宣布以羅永浩數(shù)字人為藍(lán)本的新一代技術(shù)實(shí)現(xiàn)了平臺(tái)化,預(yù)計(jì)將于今年10月正式上線。
該技術(shù)實(shí)現(xiàn)了三大核心突破:依托文心大模型4.5Turbo的大師級(jí)劇本模式,能生成優(yōu)質(zhì)腳本并驅(qū)動(dòng)多模態(tài)協(xié)同,讓數(shù)字人在直播間實(shí)現(xiàn)形神音容的高度匹配;搭載的 AI 大腦可實(shí)時(shí)接收直播數(shù)據(jù)并自主決策,調(diào)度多智能體完成問答互動(dòng),并結(jié)合熱點(diǎn)輸出風(fēng)格化內(nèi)容;高效復(fù)刻能力僅需10分鐘真人樣本,就能完成聲情動(dòng)作復(fù)刻,實(shí)現(xiàn)聲音、動(dòng)作與氛圍的精準(zhǔn)匹配。
同時(shí),得益于其低門檻、高表現(xiàn)力的特點(diǎn),能夠?qū)⒘_永浩數(shù)字人的能力,復(fù)刻到每一個(gè)主播身上,“讓每一個(gè)人通過自己的數(shù)字人,都能變身超級(jí)主播,讓人人都有機(jī)會(huì)成為羅永浩”。
截至目前,百度慧播星已經(jīng)邀請(qǐng)了教育、健康等十余個(gè)行業(yè)的商家和達(dá)人,利用最新的NOVA技術(shù)打造了自己的數(shù)字人分身進(jìn)行直播,且都取得了不錯(cuò)的成績(jī)。像是知識(shí)博主艾彌兒的數(shù)字人憑借萬億級(jí)知識(shí)庫(kù),將用戶停留時(shí)長(zhǎng)提升101%;蒙牛悠瑞的數(shù)字人通過全時(shí)段服務(wù)與動(dòng)態(tài)策略,使轉(zhuǎn)化率提高 33%。
隨著NOVA陸續(xù)向更多的商家和達(dá)人開放,普通用戶也可獲得媲美頭部主播的專業(yè)帶貨能力,這標(biāo)志著超頭主播能力復(fù)刻進(jìn)入規(guī)模化量產(chǎn)時(shí)代,更有望重構(gòu)直播電商生態(tài),推動(dòng)行業(yè)的新一輪變革。
三大核心突破,數(shù)字人正在超越真人
作為業(yè)界首個(gè)AI全棧式數(shù)字人直播解決方案,百度慧播星一直以來都在持續(xù)探索數(shù)字人技術(shù)新的可能。
而新一代數(shù)字人技術(shù)NOVA的發(fā)布,則意味著類似羅永浩數(shù)字人的體驗(yàn),將得到規(guī)模化的落地應(yīng)用。
在這背后,是NOVA圍繞數(shù)字人的大師級(jí)劇本模式、AI大腦、高效復(fù)刻能力實(shí)現(xiàn)了三大核心突破,最終借助六大能力的支撐,讓數(shù)字人的表現(xiàn)力和效果“更逼真”“更智能”。
“更逼真”方面,NOVA針對(duì)數(shù)字人的劇本、動(dòng)作和聲音,進(jìn)行了新一輪升級(jí)。
早在今年4月,慧播星就首次發(fā)布了“劇本模式”,能夠?qū)崿F(xiàn)數(shù)字人“神、形、聲、貌”的多模態(tài)統(tǒng)一。
而如今,最新升級(jí)后的NOVA推出了大師級(jí)劇本模式,將角色、動(dòng)作、聲音、氛圍等劇本要素及參考信息輸入給文心大模型后,大模型便會(huì)通過深度學(xué)習(xí)、調(diào)動(dòng)億萬級(jí)知識(shí)儲(chǔ)備,產(chǎn)出具備多種風(fēng)格的高質(zhì)量劇本內(nèi)容,而后再通過驅(qū)動(dòng)多模態(tài)協(xié)同,實(shí)現(xiàn)直播間神形音容的高度統(tǒng)一。
因此在直播中,我們能看到數(shù)字人主播根據(jù)劇本要素說明、商品信息、人設(shè)要求等參考信息,實(shí)時(shí)調(diào)整語(yǔ)調(diào)、表情和動(dòng)作,表現(xiàn)出的情緒轉(zhuǎn)換與動(dòng)作銜接如同真人般自然流暢。
此外,在動(dòng)作上,NOVA支持動(dòng)作生成功能,表現(xiàn)力得到全面提升,即使是雙人互動(dòng)看起來也毫無違和感。
比如此前的羅永浩數(shù)字人直播中,我們看到搭檔的數(shù)字人能夠注視并認(rèn)真傾聽對(duì)方說話,二人同時(shí)講解時(shí)的銜接也自然流暢、配合默契。帶貨時(shí),還支持持品動(dòng)作生成,并與貨品互動(dòng),足以體現(xiàn)NOVA數(shù)字人應(yīng)對(duì)復(fù)雜場(chǎng)景的強(qiáng)大能力。
至于聲音的高度還原,對(duì)于NOVA來說就更不在話下了。其不僅打破了大眾對(duì)于數(shù)字人“機(jī)械音”的刻板印象,做到了說話抑揚(yáng)頓挫的“超擬真”,而且還支持打斷說、同時(shí)說等雙人對(duì)話場(chǎng)景。配合劇本模式,數(shù)字人主播更是可以做到“有感情”“有風(fēng)格”,連真人主播的口頭禪等都能完美復(fù)刻。
“更智能”方面,主要體現(xiàn)在NOVA對(duì)于腳本、問答、互動(dòng)三大能力的支撐。
以往的數(shù)字人主播,很多都只能做到“照本宣科”,或者對(duì)于部分問題能有預(yù)設(shè)好的回答。但這一方面顯得很生硬,無法回答部分問題,會(huì)影響到消費(fèi)者體驗(yàn);另一方面還需要直播間的運(yùn)營(yíng)人員前期做很多準(zhǔn)備,人力投入同樣不小。
而NOVA得益于百度長(zhǎng)期以來沉淀的技術(shù)實(shí)力,擁有著一顆超強(qiáng)的“AI大腦”,不僅可以深度學(xué)習(xí)人設(shè)腳本,還原個(gè)性化的帶貨風(fēng)格,還能在直播中自主思考進(jìn)行靈活決策,進(jìn)而調(diào)度多智能體實(shí)現(xiàn)與用戶的問答與互動(dòng)。
簡(jiǎn)單來說就是,NOVA已經(jīng)不再局限于精準(zhǔn)回答用戶的問題,更是能夠結(jié)合時(shí)事熱點(diǎn),有趣味、高情商地與用戶互動(dòng)。
比如此前的羅永浩數(shù)字人直播我們就看到,數(shù)字人甚至還能時(shí)不時(shí)拋出幾個(gè)段子炒熱直播間的氛圍。當(dāng)有觀眾提及關(guān)注度很高的“蘇超”足球比賽時(shí),數(shù)字人羅永浩幽默地回應(yīng)稱:“我知道蘇超最近挺火的,什么比賽第一友誼第十四,熱梗挺多的,我建議國(guó)足也和蘇超學(xué)學(xué)。”
由此可見,NOVA數(shù)字人能夠高度還原主播的個(gè)人風(fēng)格,不僅接住了用戶的問題,還巧妙地進(jìn)行了聯(lián)想和展開,給觀眾帶來了幾乎與羅永浩本人無異的體驗(yàn)。
不僅如此,相比于真人主播,NOVA數(shù)字人還有一大優(yōu)勢(shì)就是比人更“聰明”。對(duì)于這一點(diǎn),全網(wǎng)千萬粉絲的達(dá)人艾彌兒就深有感觸。





京公網(wǎng)安備 11011402013531號(hào)