AI 根據聲音內容幫照片“對口型”，螞蟻集團開源 EchoMimic 項目

IP屬地中國·北京 編輯：劉敏 IT之家 時間：2024-07-11 17:13:00

7 月 11 日消息，螞蟻集團 10 日開源了名為 EchoMimic 的新項目，其能夠通過人像面部特征和音頻來幫人物“對口型”，結合面部標志點和音頻內容生成較為穩定、自然的視頻。
該項目具備較高的穩定性和自然度，通過融合音頻和面部標志點（面部關鍵特征和結構，通常位于眼、鼻、嘴等位置）的特征，可生成更符合真實面部運動和表情變化的視頻。
其支持單獨使用音頻或面部標志點生成肖像視頻，也支持將音頻和人像照片相結合做出“對口型”一般的效果。據悉，其支持多語言（包含中文普通話、英語）及多風格，也可應對唱歌等場景。
附相關鏈接：
項目地址：https://badtobest.github.io/echomimic.html Github：https://github.com/BadToBest/EchoMimic

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

Windows 11任務欄至今仍無法自由移動！微軟終于給出原因：沒用舊代碼

東安動力首臺轉子發動機R05E點火成功，2027年量產

挑戰液態海洋共識：NASA研究稱土衛六含太陽系最大“冰沙”

曝TikTok交易達成，美國和字節跳動各掌握一家公司

AI賦能流程神州數碼汽車行業AI 應用落地研討會在滬舉辦

希迪智駕港交所上市，成港股首家商用車智能駕駛公司

全站最新

Windows 11任務欄至今仍無法自由移動！微軟終于給出原因：沒用舊代碼

東安動力首臺轉子發動機R05E點火成功，2027年量產

挑戰液態海洋共識：NASA研究稱土衛六含太陽系最大“冰沙”

曝TikTok交易達成，美國和字節跳動各掌握一家公司

熱門推薦

基于阿里千問，烏干達打造本土大模型

比亞迪正式進入伊拉克市場，推出BYD SHARK 6

金沙酒業營銷負責人更迭，王維龍離職，韓玉國接棒

Windows 11任務欄至今仍無法自由移動！微軟終于給出原因：沒用舊代碼

東安動力首臺轉子發動機R05E點火成功，2027年量產

挑戰液態海洋共識：NASA研究稱土衛六含太陽系最大“冰沙”

曝TikTok交易達成，美國和字節跳動各掌握一家公司

AI賦能流程神州數碼汽車行業AI 應用落地研討會在滬舉辦

希迪智駕港交所上市，成港股首家商用車智能駕駛公司

千問App辟謠：全員大會集體吃豆包圖是AI生成的

你的“大廠經驗”，在AI面前可能一文不值

科學與健康|改寫生命演化史！2025我國古生物學研究在多領域取得突破

他設計的手機賣了1.5億臺 | 我們的四分之一世紀

VEX機器人亞洲公開賽在京開幕，全球近30國青少年選手參賽

拼多多：趙佳臻獲任聯席董事長，與陳磊共同擔任集團聯席董事長兼聯席CEO