8月17-21日,國際音頻領(lǐng)域頂級會議INTERSPEECH在荷蘭鹿特丹舉辦。榮耀聯(lián)合上海交通大學完成的兩篇聚焦端側(cè)多語種任務的研究成果成功入選INTERSPEECH2025錄用論文,并受邀在會議上作技術(shù)發(fā)表。作為全球語音科學與技術(shù)領(lǐng)域最具權(quán)威性的學術(shù)會議之一,INTERSPEECH的認可體現(xiàn)了榮耀在端側(cè)AI語音技術(shù)領(lǐng)域的持續(xù)努力與技術(shù)積累,這表明榮耀在全球化的AI技術(shù)交流中,取得了一定進展。
雙論文入選國際頂會
INTERSPEECH作為國際音頻領(lǐng)域頂級會議,其收錄論文代表著全球語音技術(shù)研究的最前沿方向。榮耀的兩篇論文成功入選,聚焦的正是當前端側(cè)AI語音技術(shù)的核心難題——如何在移動設備有限的算力與存儲資源下,實現(xiàn)媲美云端的多語種實時語音識別與通話翻譯體驗。
![]()
![]()
榮耀兩位AI專家在荷蘭鹿特丹INTERSPEECH學術(shù)交流現(xiàn)場作技術(shù)發(fā)表
據(jù)了解,榮耀研發(fā)團隊與上海交通大學的聯(lián)合攻關(guān),針對“端側(cè)實現(xiàn)高準確率、高響應速度翻譯體驗”的技術(shù)痛點提出獨創(chuàng)性解決方案,相關(guān)技術(shù)已成功轉(zhuǎn)化為可落地的端側(cè)多語種通話翻譯功能,實現(xiàn)了從學術(shù)研究到產(chǎn)業(yè)應用的無縫銜接。
構(gòu)建全球首個端側(cè)語音大模型
在移動互聯(lián)網(wǎng)時代,語音已成為人機交互的核心入口,而端側(cè)語音技術(shù)的突破直接關(guān)系到用戶體驗。長期以來,行業(yè)面臨著兩難困境:依賴云端處理的語音翻譯方案存在隱私泄露風險,而傳統(tǒng)端側(cè)方案又受限于設備算力,難以實現(xiàn)實時性與準確性的兼顧。
榮耀的研究項目啟動之初就確立了“純端側(cè)實現(xiàn)媲美云端的通話翻譯體驗”的目標,這意味著研發(fā)團隊必須在算力、存儲、功耗多重約束下,解決兩大核心挑戰(zhàn):一是如何讓AI在極短時間內(nèi)精準識詞,實現(xiàn)低延遲與高準確率的平衡;二是如何在有限資源下保證翻譯響應的流暢性與實時性。
經(jīng)過多次技術(shù)迭代,榮耀團隊創(chuàng)造性地提出兩大技術(shù)方案:其一,通過創(chuàng)新的注意力機制與決策策略結(jié)合,讓端側(cè)AI實現(xiàn)流式語音識別能力,無需等待用戶說完整句話即可啟動識別與翻譯,徹底打破傳統(tǒng)方案的延遲瓶頸,真正做到“邊說邊識別”;其二,提出全新的投機采樣推理模塊,通過直接與主模型的“大腦”協(xié)同工作,即時讀取并利用主模型已經(jīng)形成的“記憶”和“思路”來高效預測接下來可能出現(xiàn)的詞,在不降低準確性的前提下實現(xiàn)推理速度的顯著提升。
這兩項技術(shù)方案不僅通過了權(quán)威學術(shù)評審,同時在實測中展現(xiàn)出強大性能:將傳統(tǒng)方案3-4GB的內(nèi)存占用壓縮至800MB,節(jié)省75%存儲空間;翻譯準確率提升16%,推理速度提升38%,真正實現(xiàn)了“小而美”的突破。
依托這些技術(shù)創(chuàng)新,榮耀成功構(gòu)建起全球首個端側(cè)語音大模型,將中、英、德、法、西、意等6個語種包嵌入僅0.8B參數(shù)量的模型中,用戶無需額外下載語音包即可實現(xiàn)多語種互譯,且支持離線使用——這意味著即便在無網(wǎng)絡環(huán)境下,語音數(shù)據(jù)也能在本地完成處理,從源頭保障隱私安全。
榮耀AI技術(shù)矩陣構(gòu)建全生態(tài)體系
榮耀在端側(cè)AI語音技術(shù)領(lǐng)域的突破,并非偶然,而是品牌長期深耕AI戰(zhàn)略的必然結(jié)果。自阿爾法戰(zhàn)略公布以來,榮耀在AI技術(shù)領(lǐng)域的投入始終保持“持續(xù)性”與“前瞻性”,從AI體驗落地到技術(shù)開源,再到端側(cè)語音大模型突破,形成了清晰的戰(zhàn)略演進路徑。
此前,在世界人工智能大會(WAIC)期間,榮耀正式發(fā)布自研多模態(tài)感知大模型——MagicGUI大模型。作為榮耀推出的首個GUI開源大模型,MagicGUI以7B(70億)參數(shù)規(guī)模,支撐底層AI智能體的多模態(tài)感知與自動執(zhí)行規(guī)劃能力,比肩SOTA模型達到行業(yè)領(lǐng)先水平。





京公網(wǎng)安備 11011402013531號