作者丨歐雪
編輯丨袁斯來
當(dāng)巨頭都想做點(diǎn)軟硬件結(jié)合時(shí),它們動(dòng)動(dòng)手指,足以震碎很多創(chuàng)業(yè)公司腳下的冰面。
在AI翻譯準(zhǔn)確率突破95%的2025年,AI翻譯耳機(jī)或許是最容易被巨頭吞噬的硬件品類。它們不需要做什么硬件層面的改動(dòng),只需要集合軟件功能。
過去一兩年,幾乎每個(gè)安卓廠商都在自己的耳機(jī)里加入了翻譯功能。但直到9月10日凌晨,當(dāng)蘋果宣布AirPods要推出實(shí)時(shí)翻譯功能后,翻譯耳機(jī)的創(chuàng)業(yè)者們才真切感覺到寒意——全球TWS中,蘋果一家就占了23%的份額。
翻譯是個(gè)顯而易見的需求,遲早會(huì)成為所有大廠耳機(jī)的標(biāo)配。這場(chǎng)沖擊并不意外。
其實(shí),2023年左右,AI翻譯軟件免費(fèi)后,大量白牌早就充斥市場(chǎng)。不想卷價(jià)格的獨(dú)立廠牌殺出重圍后,又不得不直面巨鱷撕咬。
深圳企業(yè)時(shí)空壺(Timekettle)是堅(jiān)持下來的硬件廠商之一。翻譯行業(yè)競(jìng)爭(zhēng)愈演愈烈時(shí),時(shí)空壺2024年其營(yíng)收達(dá)2億元,2025年累計(jì)營(yíng)收持續(xù)大幅增長(zhǎng),連續(xù)六年行業(yè)第一,累計(jì)用戶超過百萬,覆蓋全球170多國(guó)。
時(shí)空壺創(chuàng)始人田力出身華為。或許和過去的行業(yè)經(jīng)歷有關(guān),時(shí)空壺一直堅(jiān)持硬件優(yōu)先。其旗下翻譯耳機(jī)定價(jià)千元,通過硬件實(shí)現(xiàn)“邊說邊譯”,努力還原自然的對(duì)話體驗(yàn)。
而面對(duì)蘋果的AI功能,時(shí)空壺創(chuàng)始人田力有他自己的應(yīng)對(duì)。“巨頭的邏輯是在現(xiàn)有生態(tài)上疊加翻譯功能,”時(shí)空壺創(chuàng)始人田力表示,“而我們的邏輯是重構(gòu)整個(gè)跨語言交流系統(tǒng)。”
這不是時(shí)空壺獨(dú)一家的挑戰(zhàn)。“整個(gè)翻譯行業(yè)來看,行業(yè)的成熟度都還不夠。”田力稱。這是一個(gè)需求細(xì)分的時(shí)代,他們必須在無數(shù)縫隙中找到差異化定位。
田力認(rèn)為,目前AI更多是直譯,能理解文化語境自然翻譯的,可能只有10%到20%。AI是技術(shù)理性的一個(gè)高峰,它能完成基礎(chǔ)的翻譯,但語言需要情感賦予更多意義。一個(gè)要讓人持續(xù)使用的翻譯產(chǎn)品,決不能只有工具屬性。
“語言障礙是一個(gè)古老且普遍的問題,翻譯這個(gè)職業(yè)存在了數(shù)千年。”田力表示,“人類翻譯很多時(shí)候不是逐詞翻譯,而是理解你的意圖并準(zhǔn)確表達(dá)出來。”
對(duì)此,大公司未必有耐心去做持續(xù)、細(xì)微的優(yōu)化。這也成為創(chuàng)業(yè)公司的機(jī)會(huì)。
我們和田力做了一次對(duì)話,和他討論了目前的市場(chǎng)競(jìng)爭(zhēng)以及AI耳機(jī)的未來走向。
![]()
行業(yè)尚在早期
硬氪:你覺得目前AI翻譯領(lǐng)域的競(jìng)爭(zhēng)狀況如何?
田力:我們其實(shí)不是很關(guān)注業(yè)內(nèi)競(jìng)爭(zhēng),這是一個(gè)很真實(shí)的回答。最核心的原因在于,我覺得整個(gè)行業(yè)的成熟度還不夠。現(xiàn)在比誰做得好就像“比爛”,沒太大意義。
目前行業(yè)的競(jìng)爭(zhēng)烈度其實(shí)不高,但作為業(yè)內(nèi)跑得較前面一點(diǎn)的企業(yè)來說,我們確實(shí)會(huì)受到更多的模仿,比如雙向同傳、外放對(duì)話這些模式都是我們先做的。
我們的核心始終是解決問題,尤其是解決人們的交流障礙。語言障礙是一個(gè)古老且普遍的問題,翻譯這個(gè)職業(yè)存在了數(shù)千年,解決這個(gè)問題極具價(jià)值。我們不想盲目追逐熱點(diǎn),而是希望有一天,用戶不再記得我們是做耳機(jī)還是硬件,而是知道我們能幫助他們克服語言障礙。
硬氪:那你怎么看待谷歌、蘋果等大廠也進(jìn)入翻譯領(lǐng)域?會(huì)有壓力嗎?
田力:首先再次表示,我們其實(shí)不是特別關(guān)注競(jìng)爭(zhēng),因?yàn)檫@個(gè)行業(yè)確實(shí)還不夠成熟。其次,巨頭的邏輯是在其現(xiàn)有生態(tài)上“疊加功能”(如蘋果在AirPods上加翻譯),而我們的邏輯是“重構(gòu)整個(gè)交流系統(tǒng)”。出發(fā)點(diǎn)不同,最終解決方案的效率和體驗(yàn)也會(huì)不同。
硬氪:那與競(jìng)爭(zhēng)對(duì)手相比,時(shí)空壺的核心護(hù)城河是什么?
田力:我覺得還是在認(rèn)知層面上。我們關(guān)注點(diǎn)在于交流場(chǎng)景本身,而非某種具體的硬件形態(tài)。我們從一開始就不是單純地聚焦于耳機(jī)這種形態(tài),而是思考耳機(jī)這種交互體驗(yàn)?zāi)芊褡寖蓚€(gè)人交流得更自然。如果做不到,我們就會(huì)對(duì)耳機(jī)進(jìn)行改造。這也就是為什么我們前幾代產(chǎn)品甚至沒有使用藍(lán)牙耳機(jī)芯片,因?yàn)槲覀兊闹匦母静辉诖螂娫掃@些傳統(tǒng)功能上。隨著時(shí)間推移,這種底層邏輯會(huì)形成品牌、用戶心智上的護(hù)城河。
![]()
W4 AI同傳耳機(jī)-骨聲紋識(shí)別技術(shù)(圖源/企業(yè))
硬氪:時(shí)空壺海外收入占比達(dá)70%,在適應(yīng)不同市場(chǎng)的文化、語言和政策時(shí),遇到過哪些意想不到的挑戰(zhàn)?
田力:最有挑戰(zhàn)性的還是對(duì)用戶的理解。在中國(guó),大量場(chǎng)景與商務(wù)洽談相關(guān)。但在美國(guó),作為移民大國(guó),約20%的人口是移民,其中約50%的移民,也就是2000多萬人,英語水平有限。很多人在跨國(guó)移民生活中會(huì)用到我們的產(chǎn)品,這在國(guó)內(nèi)可能覺得新奇,但在國(guó)外卻很常見。
硬氪:目前公司的財(cái)務(wù)狀況如何?是否盈利?
田力:公司已經(jīng)實(shí)現(xiàn)盈利。我們并不刻意追求營(yíng)收的高速增長(zhǎng),而是更注重保持健康的盈利能力和產(chǎn)品成熟度。在行業(yè)早期,追求竭澤而漁的增長(zhǎng)反而會(huì)帶來反噬。
硬氪:目前很多翻譯設(shè)備依賴云端大模型。但業(yè)界也有“端側(cè)AI”的強(qiáng)烈趨勢(shì)。時(shí)空壺是否會(huì)考慮布局“端側(cè)AI”?
田力:端側(cè)AI對(duì)我們來說非常重要,因?yàn)樵诤芏嗟胤骄W(wǎng)絡(luò)條件并不理想。人們對(duì)我們的產(chǎn)品要求很高,一旦網(wǎng)絡(luò)不好,兩個(gè)人就無法交流,立刻陷入困境。所以,端側(cè)AI是我們必須布局的。
硬氪:未來會(huì)考慮除了“語音”外其他的多模態(tài)交互方式嗎?比如手勢(shì)、語氣?
田力:這是一個(gè)很大膽的想法。像一些眼鏡公司所做的多模態(tài)輸入,通過手勢(shì)來理解意圖是比較難的,因?yàn)槭謩?shì)是非標(biāo)準(zhǔn)化的。
但你提到的語氣,我覺得這部分相對(duì)可以標(biāo)準(zhǔn)化。比如憤怒、疑問、困惑或高興的語氣,是可以逐漸往標(biāo)準(zhǔn)化方向推進(jìn)的。這也是我們內(nèi)部正在研究的方向。
![]()
AI翻譯離自然還很遠(yuǎn)
硬氪:你覺得AI翻譯和人工翻譯這兩者未來的關(guān)系會(huì)是怎樣的?時(shí)空壺怎么定義兩者的關(guān)系?
田力:我們把AI翻譯也像自動(dòng)駕駛一樣分成了L1到L5,我認(rèn)為現(xiàn)在大家能做到的大概是一個(gè)L3的水平。而人類的水平,特別是對(duì)于那種高級(jí)的譯員水平,他毫無疑問是L4甚至L5的。
L3和L4、L5最大的區(qū)別,我覺得本質(zhì)上在于信任程度。L3只是可用,而L4和L5則是你真正可以放心地將事情交給它,讓它幫你去交流和解決問題。
這里面的迭代包含兩個(gè)方面,第一是它需要像人一樣有同理心,能夠理解并傳達(dá)你真正想表達(dá)的意思,而不僅僅是直譯。人類翻譯很多時(shí)候就是這樣,不是逐詞翻譯,而是理解你的意圖并準(zhǔn)確表達(dá)出來,這就是從L3到L4的一個(gè)關(guān)鍵分界線。第二則是產(chǎn)品本身,交互體驗(yàn)上還有很多細(xì)節(jié)需要打磨。
硬氪:從L3到L4的躍遷,你覺得大概要多久?
田力:我覺得可能樂觀的話,大概需要2到3年。因?yàn)檫@里面有兩個(gè)部分需要共同進(jìn)化,前者屬于整個(gè)業(yè)界都在推進(jìn)的領(lǐng)域,是大智能體系下的一個(gè)分支;而后者則需要產(chǎn)品公司去細(xì)致琢磨,用戶在體驗(yàn)層面還能如何進(jìn)一步提升。
硬氪:在用戶體驗(yàn)層面,其實(shí)不同語言中的文化隱喻、俚語很多。時(shí)空壺怎么嘗試?yán)斫夂捅A暨@些“言外之意”?
田力:我覺得這恐怕是整個(gè)行業(yè)面臨的問題,僅靠一己之力很難全部搞定。目前我們能做的,可能是在收集語料方面做一些工作,比如在中英、西班牙語等語言上進(jìn)行更多嘗試。但從長(zhǎng)期來看,像谷歌這樣的大公司會(huì)做一些基礎(chǔ)性的工作,我們則可以站在巨人的肩膀上,專注于我們更擅長(zhǎng)的細(xì)節(jié)部分。
硬氪:那你覺得目前AI翻譯對(duì)文化理解的程度有多少?
田力:我覺得目前可能只有10%到20%,大家還是剛往直譯的角度去做嘗試。但我相信時(shí)間不會(huì)太長(zhǎng),可能再過半年左右,你就會(huì)看到我們的產(chǎn)品有顯著進(jìn)化。
比如,現(xiàn)在產(chǎn)品已經(jīng)分為基本AI翻譯和大模型翻譯兩種模式。從技術(shù)角度看,這是不同的技術(shù)路徑。但從消費(fèi)者角度看,他們關(guān)注的是翻譯能否善解人意,還是完全不改變?cè)狻⒉磺獾乃腊宸g。到時(shí)候你會(huì)看到這兩種模式會(huì)有顯著區(qū)別。
硬氪:那對(duì)于翻譯中出現(xiàn)的“幻覺”(胡編亂譯)或錯(cuò)誤,你如何看待和界定其中的責(zé)任?
田力:實(shí)事求是地說,比如在美國(guó),我們的產(chǎn)品在醫(yī)療機(jī)構(gòu)也有一些應(yīng)用場(chǎng)景。但目前來看,相關(guān)責(zé)任的界定還并不清晰。
就像自動(dòng)駕駛汽車出車禍后法律界定尚不明確一樣,目前,我們的應(yīng)用更多還處于L3層面,主要是輔助性質(zhì)的。不過,AI翻譯還沒有達(dá)到像自動(dòng)駕駛那樣嚴(yán)肅的程度,畢竟自動(dòng)駕駛涉及人命關(guān)天的問題。
![]()
W4Pro AI同傳耳機(jī) 商務(wù)洽談(圖源/企業(yè))
硬氪:下一代AI翻譯設(shè)備會(huì)是什么樣子?時(shí)空壺有沒有一些最新的研究方向可以分享?
田力:最理想的未來產(chǎn)品其實(shí)很簡(jiǎn)單,使用時(shí)能達(dá)到我們現(xiàn)在自然溝通的效果。但我們都清楚,距離這個(gè)目標(biāo)還很遠(yuǎn),這正是我們正在努力的方向。
目前,我們始終圍繞兩條技術(shù)主線展開工作。第一是收音質(zhì)量,即使在復(fù)雜環(huán)境下也能精準(zhǔn)收音。這與傳統(tǒng)耳機(jī)的最大區(qū)別在于,傳統(tǒng)耳機(jī)強(qiáng)調(diào)收音干凈,而我們不僅要求干凈,還要求音質(zhì)足夠好,以便傳輸?shù)皆贫撕竽茏寵C(jī)器更好地識(shí)別和翻譯。第二是AI本身的智能層面,比如能否支持更多小語種,以及在同理心和更精準(zhǔn)的意義翻譯上做得更好。
未來2-3年,最核心、最壓倒一切的目標(biāo)就是將產(chǎn)品體驗(yàn)從L3提升到L4。我們相信,一旦實(shí)現(xiàn)這個(gè)目標(biāo),公司的業(yè)績(jī)、利潤(rùn)等財(cái)務(wù)指標(biāo)都自然不再是問題。





京公網(wǎng)安備 11011402013531號(hào)