10月20日訊(記者 朱俊熹)近半個月以來,你可能常在各大社交媒體的視頻流中刷到這樣的畫面:路人在街頭采訪中被問及知道自己是AI生成的嗎、交警追逐攔下駕駛車輛的貓貓狗狗、現(xiàn)身中國不同高鐵站的OpenAI CEO Sam Altman
只不過這些都不是真實發(fā)生的,而是由OpenAI Sora 2模型生成的AI視頻。這些看似逼真卻脫離現(xiàn)實的視頻內(nèi)容,推動著Sora App在過去十多天內(nèi)穩(wěn)居免費應(yīng)用榜單首位,不到五天下載量便突破百萬次,增長速度甚至超過了ChatGPT。即便競爭對手谷歌于上周推出了新的視頻模型Veo 3.1,其相關(guān)AI應(yīng)用Gemini目前仍排在Sora、ChatGPT之后。
但另一方面,新的Sora 2模型也為OpenAI招致了大量有關(guān)版權(quán)與安全的批評。當(dāng)?shù)貢r間10月17日,OpenAI宣布暫停在Sora平臺上生成涉及美國黑人民權(quán)領(lǐng)袖馬丁路德金形象的內(nèi)容,同時強化針對歷史人物的安全防護(hù)機制。此前,通過Sora生成的馬丁路德金發(fā)表粗俗言論或偷竊商品等AI視頻在網(wǎng)上廣泛傳播,其家人對此表示強烈不滿。
無論人們是否歡迎,AI已經(jīng)在改變社交媒體。OpenAI更是憑借其強大的影響力,進(jìn)一步推動了AI視頻的大眾化。OpenAI曾將Sora 2形容為視頻領(lǐng)域的GPT-3.5時刻。三年前,正是基于GPT-3.5的ChatGPT首次面世,掀起了新一輪AI浪潮。那么,剩下的問題是:人類做好準(zhǔn)備迎接Sora 2時代了嗎?
眼見不再為實,AI視頻進(jìn)入社交時代
AI產(chǎn)品經(jīng)理Keith是第一批試用Sora App的用戶,但沒過幾天,他就對這款新應(yīng)用失去了興趣,幾乎很少再打開。最令他感到生理不適的,是那些主打真實向的AI視頻。畫面中的街景和人物幾乎與社交媒體上的日常Vlog無異,讓人很難分辨出哪些是實拍的、哪些是AI生成的。
人類的生存本能之一,是要分辨信息的真假,但這些AI視頻在瘋狂挑戰(zhàn)這個本能。Keith對藍(lán)鯨科技記者表示。在Sora里看到的所有東西都是假的,會讓人一直很疲憊,就像被丟進(jìn)一個《楚門的世界》里。
Sora截圖
AI安全公司瑞萊智慧RealAI聯(lián)合創(chuàng)始人、算法科學(xué)家蕭子豪告訴藍(lán)鯨科技,人類千百年來的傳統(tǒng)認(rèn)知是耳聽為虛,眼見為實,即二手信息真?zhèn)坞y辨,一手信息才真實。而如今,這一認(rèn)知在AI時代受到了極大的挑戰(zhàn)甚至顛覆。隨著AI技術(shù)的持續(xù)迭代,這類內(nèi)容變得越來越逼真和易于使用,人類的肉眼和耳朵已無法辨別一手信息的真?zhèn)巍?/p>
就Sora 2模型而言,OpenAI稱其在物理準(zhǔn)確性、逼真度和可控性方面均超越前代模型。例如當(dāng)運動員投籃不中時,上一代視頻模型為執(zhí)行指令可能會扭曲物體或現(xiàn)實,導(dǎo)致球突然傳送到籃筐。而在Sora 2中,球會從籃板反彈,其遵循物理定律的能力得到顯著優(yōu)化。此外,Sora 2還是繼谷歌Veo 3后的又一款音視頻生成模型,支持對話與音效同步。
在前述AI產(chǎn)品經(jīng)理Keith看來,除了生成時長和視頻效果等方面的優(yōu)勢,Sora 2的火爆還與產(chǎn)品層面的設(shè)計相關(guān)。初期該模型采取免費開放的模式,并提供充裕的初始配額供用戶自由探索其功能。所有用戶都可以在App和網(wǎng)頁版上生成最長15秒的視頻,專業(yè)版付費用戶則可生成最長25秒的視頻。其次,Sora App還內(nèi)置了類似抖音等短視頻平臺的信息流,會結(jié)合用戶的Sora動態(tài)、ChatGPT數(shù)據(jù)等信息,提供個性化的推薦內(nèi)容。
Sora截圖
Sora并非第一款采用信息流模式的AI視頻類應(yīng)用。9月底,meta同樣在其AI應(yīng)用中推出視頻信息流功能Vibes。用戶在瀏覽時會看到不同創(chuàng)作者生成的AI視頻,隨著時間推移,信息流會逐漸根據(jù)用戶興趣進(jìn)行個性化推薦。成功打造出抖音的字節(jié)跳動也在自家AI內(nèi)容平臺即夢中引入了視頻流機制,用戶在刷視頻時還可以進(jìn)行評論、點贊等互動。
即夢AI截圖
在這些想成為AI版抖音的應(yīng)用中,Sora顯然取得的反響是最大的。其中一個原因在于它推出的客串(cameos)功能,支持用戶在生成的視頻片段中放入自己、朋友或任意動物的形象。同時,用戶還可以和Sora應(yīng)用中的好友一起創(chuàng)建、編輯和分享視頻內(nèi)容。OpenAI稱,在所有主要平臺都在逐漸淡化社交圖譜的時期,cameos將強化社區(qū)感。
Sora用關(guān)系替代了質(zhì)量門檻,讓內(nèi)容更容易被消費。AI創(chuàng)業(yè)者陳鍇杰在社交平臺上表示,當(dāng)內(nèi)容發(fā)生在朋友之間時,質(zhì)量不再是唯一標(biāo)準(zhǔn)。哪怕生成結(jié)果并不完美,朋友間的互動本身就足夠有趣。
也有大模型從業(yè)者指出,隨著AI的發(fā)展,內(nèi)容的創(chuàng)作與分發(fā)必然會發(fā)生本質(zhì)改變,而Sora已經(jīng)邁出了第一步。它提出的一個大膽假設(shè)是,只要門檻做到足夠低,每個人都可以成為創(chuàng)作者,而內(nèi)容的消費者也可以是所有人。
以假亂真后,Sora的溯源攻防戰(zhàn)
當(dāng)用戶第一次登入Sora App時,會看到一句提示語:您即將踏入由AI生成內(nèi)容構(gòu)建的創(chuàng)意世界。Sora會提醒用戶,盡管一些視頻中出現(xiàn)的是認(rèn)識的人,但其行為和事件并非真實的。在Sora App上,人們尚且能夠意識到,一切都是AI生成的。但隨著這些內(nèi)容從Sora流向其他社交平臺,它們便逐漸與真實的視頻混雜在一起,使人真假難辨。
Sora截圖
對普通用戶來說,辨別AI視頻最簡單的方法,就是查看視頻是否帶有Sora、即夢AI等水印標(biāo)識。OpenAI在推出Sora 2時專門介紹稱,使用Sora生成的每一段視頻都帶有可見和不可見的溯源信號。除了明顯的水印外,生成的AI視頻還內(nèi)嵌了行業(yè)標(biāo)準(zhǔn)簽名C2PA元數(shù)據(jù)。此外,OpenAI也開發(fā)了內(nèi)部反向圖片和音頻搜索工具,能夠高精度地溯源來自Sora的視頻。
然而,互聯(lián)網(wǎng)上已開始興起各種去除Sora水印的手段。藍(lán)鯨科技記者查詢發(fā)現(xiàn),只需將Sora生成的AI視頻上傳到某些在線工具或平臺,不到一分鐘即可去除Sora的三處水印。在國內(nèi)二手交易平臺上,也有商家提供人工代處理水印服務(wù),15秒左右的視頻報價約3-4元。
二手交易平臺截圖
瑞萊智慧RealAI聯(lián)合創(chuàng)始人、算法科學(xué)家蕭子豪表示,這些去除手段主要針對顯式水印。一些用戶希望將Sora 2生成的圖像或視頻作為短視頻創(chuàng)作素材,而顯式水印會影響傳播效果,因此有去除水印的急切需求。不過他也強調(diào),去除顯式水印后仍有幾率通過其他方式進(jìn)行溯源,例如基于模型指紋的溯源,即模型在生成內(nèi)容過程中留下的隱性特征。
中科睿鑒數(shù)字合成內(nèi)容檢測專家葛星宇向藍(lán)鯨科技介紹稱,OpenAI所采取的內(nèi)嵌元數(shù)據(jù)+可見標(biāo)識+后端檢索的溯源組合是一種主動防護(hù)框架,學(xué)術(shù)界與產(chǎn)業(yè)正積極推動此類方案。在很多情形下,后端的指紋、反向搜索會比元數(shù)據(jù)更抗破壞。但若內(nèi)容經(jīng)過重合成、翻譯渲染或極端變換等大幅改動,匹配可信度也會下降。
AI視頻的侵權(quán)或違法問題,涉及復(fù)雜的法律責(zé)任鏈條。責(zé)任分配并非一刀切,一般可以包括內(nèi)容生成者、平臺運營者、模型開發(fā)者。葛星宇強調(diào)。其中,模型開發(fā)者的責(zé)任認(rèn)定最具爭議,通常認(rèn)為該主體不為工具的濫用負(fù)責(zé),除非存在重大過失。溯源工作通常由受害者、執(zhí)法機關(guān)發(fā)起,并要求平臺和開發(fā)者提供技術(shù)協(xié)助。
以中國對AI生成合成內(nèi)容的治理為例,國家網(wǎng)信辦等四部門聯(lián)合發(fā)布的《人工智能生成合成內(nèi)容標(biāo)識辦法》,今年9月1日起正式施行。標(biāo)識辦法明確,服務(wù)提供者有義務(wù)確保其生成的內(nèi)容符合標(biāo)識要求,并在生成內(nèi)容時主動添加標(biāo)識。平臺則要在內(nèi)容上架或上線時進(jìn)行審核,對未標(biāo)識或疑似生成內(nèi)容添加風(fēng)險提示。
面對市場的快速反饋,Sora 2上線幾天后,OpenAI CEO Sam Altman在個人博客中表示,這讓他想起了ChatGPT早期的日子。他還預(yù)告稱,Sora產(chǎn)品將會有非常高的變化頻率。我們會做出一些不錯的決定,也會有一些失誤,但我們會快速收集反饋并修正失誤。





京公網(wǎng)安備 11011402013531號