近日,中國人工智能學會發布2024年度“吳文俊人工智能科學技術獎”公告,京東科技人工智能團隊憑借“多模態交互式數字人關鍵技術及產業應用”項目榮獲中國智能科學技術最高獎——吳文俊人工智能科學技術獎的特等獎,也是本年度唯一的特等獎。
吳文俊人工智能科學技術獎被譽為“中國智能科學技術最高獎”,獎勵在智能科學技術領域取得重大突破、作出卓越貢獻的科技工作者以及具有重大意義的高校和企業項目,是我國人工智能領域的最高技術榮譽。這是京東集團繼2021年“商品智能匹配關鍵技術及在營銷中的應用”和2022年“任務型智能對話交互關鍵技術及大規模產業應用”之后的又一次獲獎,再次展現了京東在AI技術研發與產業應用領域的持續領先性。
多模態交互式數字人技術集語音、語義、形象等多模態技術于一體,存在諸多的技術挑戰,一直是國內外研究的前沿技術領域。在本次獲獎項目中,京東科技人工智能團隊在以下三方面實現了技術突破:提出了低成本、高保真人體建模技術,解決了人體建模成本高、觀感差難題;提出了語義一致多模態應答技術,解決了多模態語義難對齊、應答弱難題;提出了多模態自然化行為生成技術,解決了多樣化行為難協調、交互假難題。
京東多模態交互式數字人能力持續位居國際領先水平,并在2024年率先開啟行業最大規模的商業化應用,截至目前,已服務9000+商家,累計為商家帶來銷售增量超140億。2024年4月,采銷東哥AI數字人實現了高逼真、高可靠、極低幻覺率的新水平。2024年京東618期間,包括格力總裁董明珠、潔麗雅總經理“毛巾少爺”石展承、名創優品CEO葉國富等21位總裁數字人空降京東直播間,與數千家品牌商,共同創造了史上一日并行規模最大的數字人直播事件。在京東11.11、年貨節等場景,數字人與個護美妝、家電家居、母嬰寵物等品牌產生化學反應,持續帶來千人千面的直播交互體驗。

近期,京東言犀數字人技術再度進化。京東科技人工智能團隊打造的數字人通用的基座大模型,通過語音合成大模型LiveTTS及通用數字人大模型LiveHuman,僅需輸入自然語言或1秒視頻/照片,即可生成4K超高清、100%口型匹配的數字人,徹底告別數字人制作對線下拍攝、建模與耗時訓練的依賴。
LiveTTS語音合成基座模型:基于20萬小時數據訓練的擴散模型,實現“零樣本”聲音合成與多語種情感化輸出,音色相似度較其它頭部廠商高出1.3倍、字符錯誤率(CER)降低最高5.12%;
LiveHuman數字人基座模型:創新性的人體過渡幀生成技術,解決多片段銜接卡頓難題,在遮擋、大角度、動態背景、多人直播等極端條件下仍有流暢表現。
這一系列突破將單個數字人生產成本從數萬元拉低至兩位數,較真人拍攝模式成本降幅超90%,標志著數字人從“專業工具”正式成為“普惠生產力”。這將為廣告素材批量生成、新媒體投放、個人IP打造等場景應用拆掉技術藩籬,走向工業級應用。
作為一家兼具實體企業基因和屬性、先進數字技術和能力的新型實體企業,京東20多年來持續深耕供應鏈,用人工智能等數智化技術全面連接和優化社會生產、流通、消費、服務等各個環節。從零售效率提升到產業生態構建,京東始終踐行“以實助實”的路徑。截至2024年底,京東體系在基礎科學和技術研發上已累計投入近1400億元,先后推動大語言模型、語音識別及合成、數字人等一系列人工智能共性關鍵技術建設,并廣泛應用于零售、物流、工業、健康、政務等產業場景,助力千行百業實數融合,實現高質量發展。
面向未來,數字人只是京東浩瀚技術創新版圖中的一小部分。京東正加速推動AI構建新質生產力,讓每個企業乃至個人都能更高效率、更低門檻擁抱AI。
(注:此文屬于登載的商業信息,文章內容不代表本網觀點,僅供參考。)





京公網安備 11011402013531號