![]()
新智元報道
編輯:Aeneas 桃子
WAIC 2025大會上,一套國產AI同傳系統技驚四座。從AI教父Hinton金句翻譯,到多語種實時翻譯,它實現了2秒極致響應,超8萬專業詞匯拿捏到位,如母語般絲滑交流。作為WAIC唯一翻譯合作伙伴,這家中國公司成為了全場矚目的焦點。
剛剛過去的WAIC大會現場,一套同傳系統徹底驚艷了全場。
AI教父Hinton的重磅演講《數字智能是否會取代生物智能》金句頻出,時不時引起全場贊嘆。
![]()
當他用標準的倫敦腔講述自己的觀點時,幾乎就在張口的同一瞬間,標準的中文翻譯就同步出現了右邊的大屏上。
而在場的每一位觀眾,都能立刻秒懂對應的英文內容,因為右邊的字幕精準、流暢,完全符合中文讀者的理解習慣。

無論是多專業的術語,多深奧的表達,都能立刻被這套系統完美地捕捉,轉化出的翻譯極度符合語境。
演講結束后,現場爆發出熱烈的掌聲,可以說,一方面是出于現場觀眾對于AI教父精彩演講的反響,另一方面,也是對于旁邊這位由AI「國家隊」科大訊飛打造的「AI同傳」的肯定。
要知道,2018年訊飛還在和國內其他大廠同臺競技,共同為WAIC提供AI同傳服務;而到了今年,訊飛已經成了WAIC 2025的唯一翻譯合作伙伴。
走到這個位置,懂行的人都知道一款產品得做到多么優秀才行。畢竟,WAIC的現場可隨時隨地都是真刀真槍的考驗——30多個國家、1200余位嘉賓的實時交流場景,能完美做到無障礙跨語言交流,技術門檻可謂相當高。
七年里,究竟發生了什么,讓訊飛的產品成為了國際大會的AI同傳首選?
WAIC 2025唯一翻譯合作伙伴
訊飛如何做到?
這,就要從以往同傳背后的重重難點說起。
很多人認為,如今AI大模型的突飛猛進,實時語音同傳必然變得輕而易舉。
然而出乎大家意料的是,多年以來AI同傳其實都難以完全落地。
首先的一大難點,就是實時性與高延遲之間的矛盾。
因為同傳強調的是同步,延遲必須極短,翻譯結果必須準確,還要幾乎立即同時呈現。在這種極端情況下,很難避免翻譯質量的下降。
第二大難點,就是上下文語境的精準理解。
人類語言中充滿了歧義、隱喻、指代,這些都需要結合上下文才能準確理解。想要實時準確翻譯大量專業術語,就需要提前做好知識儲備和領域知識建模。
![]()
![]()
![]()
一些讓人啼笑皆非的AI翻譯翻車現場(左右滑動查看)
更何況,大會演講者可能使用不同的方言和口音,甚至會出現口誤;會議的演講現場也環境復雜,會存在噪音、回聲、交疊說話等問題。
比如,這位日本科學院院士Toshio Fukuda的日式英語,對AI同傳就是不小的挑戰
此外,不同語言的結構差異,也會讓同傳的難度大大增加。比如中英文的語序截然不同,翻譯系統很可能需要等待一句話結束,才開始翻譯,這就會帶來嚴重的延遲。
同傳中還有一大難點,就是語音合成。在傳統同傳模式下,最終的翻譯由譯員的聲音播報,這使得聽感比視覺呈現更為流暢,不會對視覺造成干擾。
而在AI同傳要達到同樣的效果,就需要聲音快速無縫銜接,仿佛有一個真人在播報出來一樣。這就需要在技術上達到極細致的要求。
而且,同傳需要同時實現語音識別、語言理解、機器翻譯、語音合成等多個技術模塊的高度融合,技術鏈條復雜。
還有就是,高質量平行語料的匱乏,也制約了模型的訓練效果。
真正的同傳大模型,需要做到什么?
好在,現在不少AI同傳產品,開始嘗試解決這些問題,一些還取得了不錯的效果。
在國外,諸如Zoom自帶的AI Companion和Zoom Interpretation這類實時翻譯與同傳工具,能夠很好地服務于專業會議及網絡研討會。
不過,盡管它支持多種主流語言,集成度出色,非常適合商務場合使用,但翻譯質量尚有提升空間,且價格偏高,部分高級功能還需通過付費訂閱來解鎖。
Microsoft Teams,也可以通過集成Azure的語音識別和翻譯服務,從而實現多語種的字幕和翻譯,能支持70+種語言。
它的翻譯倒是很流暢,然而缺點也很明顯:設置復雜,需要一定的技術集成能力,這就大大提升了門檻,不適合亟需翻譯場景的小白用戶。
谷歌家當然也少不了類似產品。
比如Google Meet內置字幕功能+自定義集成Google Translate,就能實現AI同傳。
這個產品的特點是延遲低,非常適合教育和遠程協作。然而它的翻譯精度嚴重依賴語境,在專業術語的翻譯上時常出現翻車的情況。
視頻中可以看出,Google Meet在英語和西語的互譯上延遲極低,效果不錯
在國內,許多AI同傳產品完全不輸外國AI。
其中,作為WAIC 2025的唯一合作伙伴,科大訊飛在AI同傳領域尤為引人注目。
縱觀市場上的主流AI同傳產品,競爭的焦點普遍集中在延遲、專業術語準確度、多語言支持以及語音效果等關鍵指標上。
在這些方面,訊飛星火語音同傳大模型均表現出色。
以往很多傳統的同傳大模型,基本上采取傳統的「語音識別+文本翻譯+語音合成」串聯模式,上文所提到的種種弊病,都難以打破。
然而所有這些「魔咒」,卻都被科大訊飛的星火語音同傳大模型克服了。
該模型基于機器學習(ML)和大規模語言模型技術,實現端到端語音實時翻譯。
基于星火X1底座,其在四大維度——翻譯效果、響應時間、專業覆蓋、語音品質上,呈現出系統性領先優勢,而非單點技術突破。
![]()
它模擬了人類譯員思維鏈路,通過智能意群切分、上下文精準選詞和碎片化信息重組,實現了無縫的跨語言實時交流。
在實時性、準確性和專業性上,它在行業內都做到了最優,如母語般絲滑交流。
在保證翻譯質量的同時,模型實現了2秒極致響應,達到人類頂尖同傳譯員的水平。
全新升級的語音同傳大模型,針對醫療、制造業、金融等高壁壘專業領域深度優化,覆蓋了超8萬個專業詞匯。
實測顯示,專業內容翻譯得分超90分,業內率先達到「可用」標準。
此外,其智能雙語識別功能,在中英文混合發言的情況下,也能自動切換翻譯方向。
要知道,真正的同傳大模型,絕不能僅僅是翻譯工具,而是一種交流方式的徹底革命。
在這次Hinton演講的同傳任務中,星火語音同傳大模型的表現,實在可以稱得上是國民級AI同傳的水平,在全世界觀眾面前都十分拿得出手。
比如,當Hinton講到關于同一個詞語意義的兩種不同理論時,大模型在屏幕右側迅速給出了正確通順的翻譯——
「為了捕捉意義,我們需要一種類似關系圖的東西,心理學家曾相信一種截然不同的理論,即一個詞的意義只是一大堆語義和句法特征」
這種學術性和專業性非常高的知識,大模型能夠即時給出足夠精準的翻譯,能力可見一斑。

![]()
可以說,當競品還在苦苦追趕「能用」的水平時,星火已經狂飆到「好用」的境界,堪稱AI同傳界的「卷王」。
國內首個同傳大模型
訊飛何以快人一步?
要說現在國內做語音同傳最牛的,訊飛可真是獨一檔的存在,其他家還沒有誰能跟上這個節奏。
而這個成就,可不是一夜之間取得的。可以說,訊飛的硬核實力,靠的是20多年來在語音技術領域的「死磕」。
早在2010年,這家公司就All in深度學習搭上AI快車,成為了全球最早一批搞機器學習的玩家。
一年后,其自研的基于深度神經網絡「中文語音識別系統」正式上線,直接把行業甩在了身后。
這些都為后來的技術演進埋下了關鍵伏筆。
此后數年,訊飛在技術和應用上雙線狂飆,拿獎拿到手軟——
2018年,訊飛機器翻譯口譯能力首次拿下了CATTI翻譯資格考試;2019年,其機器閱讀理解能力,在全球首次超越人類平均水平。
在語音識別上,2016-2023年,訊飛連獲國際多通道語音分離和識別大賽CHiME五連冠;在多語種翻譯上,又在2021-2023年連續三屆拿下IWSLT冠軍。
![]()
如今星火大模型的快速迭代,直接把科大訊飛的技術底盤又往上拉了一層。
WAIC上,星火X1基于全國產算力平臺「飛星一號」,采用端到端架構,直接把傳統「語音識別-翻譯-語音合成」三步流程簡化成一步,極大提升效率、降低延遲。
這也就是為什么,我們能看到Hinton說話和字幕的出現做到了神同步。
而且,基于X1的多語言能力,星火同傳大模型不僅能「聽懂」復雜語境,還能精準捕捉語義、語調和專業術語,全場絲滑無壓力。
而這背后,都是訊飛多年來廣泛積累的數據在做支撐——他們已經為全球超過40萬場國際會議做過同傳,數據維度廣,最不缺的就是覆蓋多語種、多場景的真實語料,堪稱行業翹楚。
更不要說,訊飛的開放平臺上,還擁有廣大的52萬海外開發者。這就讓數據池源源不斷,生態持續壯大。
總之,訊飛實打實地經歷了一場場真金白銀的考驗——從北京冬奧會、進博會,再到聯合國會議,無論是多么高規格的國際場合,它的AI同傳技術都能carry全場,在每一次實戰中都獲得了滿場稱贊。
![]()
可以說,訊飛能在全球的AI同傳領域穩站C位,靠的就是一步步打出來的技術和經驗。
而現在國內首個同傳大模型的發布,更是代表著全新的里程碑。不僅訊飛交出了漂亮的成績單,在全球賽道上沖到了最前排,也讓人類的「語言無障礙」變得越來越近了。
軟硬一體,用「服務閉環」征服WAIC
WAIC上,訊飛不僅以技術實力霸屏會場,更通過「軟硬一體」的戰略,完美適配了國際會議的復雜場景。
這一現象背后,折射出AI同傳技術的新趨勢以及市場競爭的新格局。
當前來看,AI同傳市場早已從單一技術輸出,轉向了生態的競爭。一些單一技術提供商或純軟件方案,往往在復雜場景下適配性不足。
訊飛軟硬一體戰略,并非是簡單的產品堆疊,而是以星火「全家桶」為核心,通過硬件協作持續放大的技術能力。
舉個栗子,首款搭載離線LLM翻譯設備「訊飛雙屏翻譯機2.0」,能精準分離多方發言,自動切換翻譯方向,延遲率非常低。
WAIC展覽館中,一位來自泰國Omniscien公司的CTO Dion Wiggins對訊飛的多語種透明屏技術贊不絕口。
![]()
不僅如此,AI同傳的競爭已從算法精度轉向了場景適配能力,而硬件是實現這一躍遷的關鍵。
相較于純軟件方案,訊飛翻譯硬件通過場景化設計,能夠直接觸達用戶需求。
WAIC現場3款新系列的訊飛AI錄音筆的首秀,分別針對學生、職場人、商務人士提供了定制化需求,并覆蓋了課堂、辦公等多種場景。
還有訊飛同傳和同傳耳機的協作,進一步放大了星火大模型的能力。
WAIC參會者通過耳機收聽AI合成的語音,再結合屏幕的實時字幕,即能體驗「聽譯同步」的沉浸式溝通。
更重要的是,訊飛的軟硬件協作邏輯,不僅在于單一設備的突破,更在于多設備的協同,形成了覆蓋WAIC全場景的「服務閉環」。
在大會的翻譯服務點,訊飛還提供了現場租借的翻譯機,讓參會者即拿即用,與全球同行無障礙交流。
![]()
這屆WAIC大會,涵蓋了開幕式、3場主論壇,以及19場分論壇,涉及到多語言、多場景的并發需求。
訊飛同傳通過大屏幕實時呈現多語種字幕,為開幕式和分論壇的順利溝通提供了保障。
這種從前端硬件到后端服務的閉環能力,恰恰體現了訊飛對國際會議場景的深刻洞察,也彰顯了其硬件賦能在提升服務效率上的核心價值。
當然了,能成為國際會議翻譯唯一合作伙伴,不僅要技術和服務過硬,還需強大的品牌背書。
如上所述,從2018年首屆WAIC開始,訊飛就承包了翻譯重任,為各路AI大牛們「搭橋」。
如今,訊飛憑借其「全棧式」AI同傳解決方案,構建了「軟件+硬件+服務」三位一體的核心競爭力,以技術突破與生態協同重塑行業標準。
放眼未來,AI同傳在教育、旅游、醫療等領域進一步滲透,硬件賦能將成為技術落地的關鍵驅動力。
訊飛將帶領行業打破語言壁壘,登上「巴別塔」之巔,讓全球溝通更加高效、自然。
![]()





京公網安備 11011402013531號