2025-03-03 15:03:01 作者:
隨著DeepSeek在多行業內實現廣泛接入應用,各領域掀起大模型效能變革。近日,有道智云發布全新產品“有道語音同傳”,基于DeepSeek-R1和有道翻譯大模型,提供多功能的語音同傳服務,在不同語言的使用者之間實現即時溝通,可廣泛應用于國際會議、商務談判、教育培訓、旅游導覽等場景,提升跨語言交流的效率。
此前,有道智云全面擁抱DeepSeek-R1,持續推進產品升級,已實現QAnything的迭代優化,并推出了基于DeepSeek的第一款多模態交互應用AI Conversation。此次有道語音同傳的全新發布,以DeepSeek-R1的強大能效進一步推動了有道智云的語音翻譯服務升級,將滿足更多行業客戶的多元化需求。
支持100+種語言、克隆定制專屬音色,重塑跨語言溝通體驗
基于DeepSeek-R1和有道翻譯大模型的模型能力,有道語音同傳進一步結合了語音打斷、語音識別、語音合成、一句話克隆、語音降噪等算法能力,支持通話同傳、語音同傳、視頻同傳、會議同傳、網頁音視頻同傳、本地文件同傳等多功能,能夠實現實時通話、社交軟件的音視頻聊天、實時會議、瀏覽器音視頻內容等多場景下的語音轉寫與翻譯。
在語種支持方面,有道語音同傳支持中文、英文、日語、韓語、阿拉伯語、印地語、俄語等100多種輸入語言,同時支持中文、英文、日語、德語、法語、西班牙語等100多種輸出語言,以更廣泛的語種覆蓋范圍,滿足用戶在全球范圍內與不同國家、地區人士溝通的需求。
同時,在DeepSeek-R1的加持下,有道語音同傳增強了語言交互能力,語音輸入與輸出響應速度穩定維持在1-5秒,極大提高了響應速度,并進一步增強了翻譯的準確度。
值得關注的是,有道語音同傳還能實現“一句話克隆”功能,用戶只需錄制一句話,即可生成與自身聲音相似度高達95%的音色模型。利用有道自研TTS語音合成大模型,有道語音同傳生成的音色模型能夠呈現更自然的語音情感表達、更合理的停頓、更豐富的語氣,讓用戶能夠使用自身的聲音進行即時溝通,獲得個性化的語音同傳體驗。

DeepSeek加碼有道翻譯大模型,多維技術推動服務升級
作為有道智云接入DeepSeek的最新產品升級,有道語音同傳集結了有道子曰翻譯大模型與DeepSeek-R1的模型能力,構建“專業領域+通用智能”的混合架構,實現更高效準確的語言翻譯服務。
作為有道自研的翻譯大模型,子曰翻譯大模型2.0在翻譯質量、效率以及魯棒性等方面實現了質的飛躍,展現出遠超國內外通用大模型及專用翻譯模型的高強性能,為有道語音同傳提供了語言翻譯能力基底。同時,DeepSeek-R1在主題識別、邏輯推理、語義理解、上下文關聯、情感分析以及多語言支持等多維度的強大能力,進一步賦能了有道語音同傳實現更精準、順暢的語音交互。
除了大模型能力融合的加碼,有道語音同傳所實現的高效翻譯能力也離不開有道在文本到語音(TTS)和自動語音識別(ASR)技術領域內的深耕積累。基于TTS技術,有道語音同傳支持雙向流式、逐字級流式輸入及chunk級流式輸出,實現低延時的語音交互;最高支持48khz的音頻合成輸出,使其能提供高保真音質;發音準確性超98%,實現高度精準的語音翻譯效果;MOS分高達4.8以上,以高自然度呈現更接近真人聲音的語音輸出。
有道的ASR技術則憑借在匹配錯誤率、詞信息丟失、詞信息保留、詞錯誤率和詞正確率方面的顯著優勢,使有道語音同傳能實現高精度同傳,提升跨語言溝通效率。
事實上,作為網易有道的技術出口,有道智云一直為行業提供豐富的技術接口與服務,目前已與支付寶、微信、360、掌閱、網易郵箱、華為、三星、字節跳動、百度等眾多知名機構及產品建立合作關系。
借力DeepSeek與有道自研翻譯大模型的融合,有道智云以有道語音同傳的全新產品升級,進一步釋放大模型的應用價值,將助力更多行業客戶跨越語言溝通障礙。未來,有道智云將持續加碼AI底層技術研發,以技術創新推動語言服務行業的智能化升級,為更多客戶提供更高效便捷的語言交互體驗。





京公網安備 11011402013531號