![]()
封面新聞?dòng)浾?歐陽(yáng)宏宇
和外國(guó)人用各自的母語(yǔ)通話(huà),你會(huì)有哪些辦法?是使用翻譯軟件逐字逐句翻譯,或是選擇繁瑣的同聲傳譯APP,還是選擇價(jià)格昂貴的人工翻譯服務(wù)。如今,在AI大模型的賦能下,普通電話(huà)也實(shí)現(xiàn)同聲傳譯。
記者7月11日獲悉,全球首個(gè)基于大模型的電話(huà)同傳服務(wù)技術(shù)在成都舉行的2025中國(guó)移動(dòng)產(chǎn)業(yè)投資生態(tài)合作伙伴大會(huì)上公布。據(jù)介紹,該項(xiàng)技術(shù)由中國(guó)自主研發(fā),將實(shí)時(shí)語(yǔ)音通話(huà)與同傳大模型深度融合,可實(shí)現(xiàn)中英雙語(yǔ)即時(shí)互譯,打破跨國(guó)電話(huà)溝通的語(yǔ)言壁壘。目前,這一技術(shù)服務(wù)已進(jìn)入籌備階段,即將正式上線。
所謂電話(huà)同傳服務(wù),就是在通話(huà)過(guò)程中智能接收雙方語(yǔ)音流,實(shí)現(xiàn)中文與英文秒級(jí)雙向互譯。通過(guò)這一技術(shù),用戶(hù)只需一鍵開(kāi)啟同傳功能,即可實(shí)時(shí)收聽(tīng)通話(huà)原聲與高質(zhì)量譯文。
據(jù)介紹,這項(xiàng)技術(shù)基于訊飛星火同傳大模型研發(fā)。其技術(shù)原理是,基于混音技術(shù),系統(tǒng)可以模擬人類(lèi)譯員思維鏈路,實(shí)時(shí)進(jìn)行意群理解切分、上下文精準(zhǔn)選詞及碎片化信息重組,再通過(guò)流式語(yǔ)音合成技術(shù)實(shí)現(xiàn)韻律銜接與語(yǔ)速自適應(yīng)調(diào)節(jié),形成“聽(tīng)-理解-譯-說(shuō)”的流暢閉環(huán)。這樣做可以實(shí)現(xiàn)原聲與譯文的并存,翻譯內(nèi)容與原聲僅幾秒延遲,音量經(jīng)過(guò)智能優(yōu)化后,也確保了通話(huà)體驗(yàn)清晰自然。
在此之前,通話(huà)同傳技術(shù)主要局限于特定的終端和軟件上。用戶(hù)如果要在手機(jī)上和外國(guó)人用各自的母語(yǔ)通話(huà),首先需要使用譯妙蛙翻譯官、PolyPal等APP,并通過(guò)這些軟件與對(duì)方通話(huà)才能實(shí)現(xiàn)同聲傳譯。此外,部分AI眼鏡也在AI大模型的賦能下實(shí)現(xiàn)了特定場(chǎng)景的同聲傳譯能力,比如INAIR此前發(fā)布的INAIR 2 AR空間計(jì)算機(jī),就可以實(shí)現(xiàn)實(shí)時(shí)中英文語(yǔ)音翻譯。但由于應(yīng)用場(chǎng)景的限制,使得這些方式距離真正的電話(huà)同傳還有一定的差距。
在全球維度下,海外通訊巨頭已經(jīng)在電話(huà)同傳賽道布局。比如,三星電子就在去年發(fā)布的新機(jī)型中內(nèi)置“通話(huà)實(shí)時(shí)翻譯”功能,可實(shí)現(xiàn)打電話(huà)過(guò)程中對(duì)不同語(yǔ)言進(jìn)行同聲傳譯。蘋(píng)果也正和谷歌討論合作,在未來(lái)的iPhone 系列新機(jī)中集成其Gemini AI服務(wù),以布局AI翻譯賽道。
目光聚焦于電話(huà)同傳場(chǎng)景中,由中國(guó)自主研發(fā)電話(huà)同傳服務(wù)將在對(duì)外高頻國(guó)際交流場(chǎng)景中發(fā)揮重要價(jià)值。業(yè)內(nèi)人士分析稱(chēng),如跨國(guó)旅游、跨境客服,國(guó)際貿(mào)易合作等領(lǐng)域,助力組織或個(gè)人降低溝通成本,提升信息傳遞效率,減少因語(yǔ)言誤解導(dǎo)致的效率損耗與溝通風(fēng)險(xiǎn)。通過(guò)技術(shù)創(chuàng)新,電話(huà)通傳服務(wù)將推動(dòng)跨國(guó)溝通從“低效翻譯輔助”向“無(wú)障礙實(shí)時(shí)交互”升級(jí),降低全球協(xié)作成本,為各行業(yè)全球化布局提供關(guān)鍵支撐。





京公網(wǎng)安備 11011402013531號(hào)