撰文| 郝 鑫 吳先之
編輯| 王 潘
電影《某種物質》里主人公伊麗莎白為了留住青春,通過注射藥劑,分裂出了克隆體蘇。
大模型讓曾經自詡“弄潮兒”的互聯網大廠,也感受到了“衰老”的恐懼。從百度、阿里到字節,他們紛紛在尋找自己的“蘇”。
字節“豆包”正在以肉眼可見的速度進行分裂,從AI助手到輸入法,從TWS耳機到從系統上定制智能手機。
12月第1天,字節發布了一款可體驗豆包手機助手的工程樣機。手機型號為中興旗下的努比亞手機M153,硬件核心指標包括高通驍龍8至尊版芯片、16GB內存+512GB存儲,售價3499元。
![]()
其中,高通驍龍8至尊版芯片搭載了新一代Hexagon NPU可高效運行端側多模態生成式AI應用,還能支撐多模態 AI 助手實現自動語音識別、大語言模型交互等功能,為搭載豆包提供了支撐。
豆包助手落地的新“肉體”差強人意,M153機型基礎配置與同期其他品牌,還有努比亞今年旗艦相比,都算不上頂配。這可能說明字節在與手機廠商合作落地豆包手機助手時,重在體驗功能而非拼參數性能。
根據豆包實際視頻演示能夠看到,豆包手機助手提供了語音和側邊AI鍵兩種喚醒方式,無論哪種都需要與終端廠商合作開發,只是差異在于前者替代了手機廠商自己的手機助手,而后者則是定義硬件。
在喚醒條件下,豆包手機助手直接讀取屏幕內容、使用多模態理解照片、自動完成跨平臺比價下單、遠程控制汽車等。視頻重點展現了AI助手在端側部署中長文本、記憶、個性化的多種技術能力。
值得一提的是,演示視頻中還給出了一個根據規劃執行旅行中的機票、門票、餐廳預訂的案例,花費8分多鐘完成了整套操作。
豆包與手機廠商合作,超越了簡單的Agent和Computer Use操作,更像是一次Siri式的落地探索。統一化的喚起和手機操作入口,打包式的集成操作,一個全新的AI手機助手正在被大模型軟件改寫。
互相克隆與排異反應
伊麗莎白為了留住青春,需要克隆體蘇延續青春。在端側 AI 競賽中,豆包手機助手,拉開了 “互為克隆體” 的合作序幕。
![]()
為了拓展用戶規模,同時也尋找最好的落地形態,豆包進行了多種嘗試,包括PC端、移動端、網頁端、瀏覽器插件,或是內嵌入生態內,如飛書。種種嘗試似乎仍不能滿足字節的胃口,畢竟缺乏硬件載體,容易落入“輕量級外掛” 的陷阱之中。
為此,字節在去年10月,曾推出軟硬融合的Ola Friend——一款搭載了豆包的首款AI智能體耳機。不過TWS耳機的形態限制了計算與存儲,使得AI藍牙耳機必須依靠外部設備接入云端大模型,輸出AI功能。而且作為附屬配件,耳機薄弱的離線能力,存在離開手機即斷網的問題。
從實際場景來看,AI耳機最核心的功能是利用聲學信號處理與AI算法的深度融合,在語音交互層面完成從聽到理解的跨越。因此,對于豆包而言,走向手機終端,尋求與硬件更深層次的融合是必經之路。
牽手手機廠商,不止能讓豆包,對于所有AI助手而言都是跳出 “云端孤島” 困境的有效手段。手機是用戶保有量最大、每日交互最頻繁的終端,是大模型落地的必爭之地。搭載了豆包助手的AI手機,也有機會進一步激活既有的AI耳機等其他產品。
若是將華榮米OV這類手機生態完善的大廠,比作基建完善的高速公路,那么努比亞則是相對生態不夠完善的普通道路。豆包選擇與努比亞合作,既有現實考量,也是希望打造一個標桿級的“蘇”,吸引其他廠商合作。
根據視頻演示,或多或少看到豆包與努比亞手機的合作已深入到底層權限的調用,否則不可能完成OTA場景下的跨平臺動作。
豆包手機助手具備端側記憶、跨App代操作等技術,其本地加密存儲的記憶功能與GUI模擬點擊能力,讓其從工具完成了向助理的變化。而手機廠商掌控硬件工程與底層權限,握有分配服務與變現的主導權。
換言之,豆包手機助手其實給終端廠商提供了一條類似于華為的智選車合作方案,而非直接下場做手機。
以技術主導權換硬件落地,如與努比亞協同優化端側算力,與其說讓模型適配手機,不如說是適配手機芯片。借助努比亞,豆包向基于安卓的手機廠商釋放了一個相當明確的信息:生態好壞與否不重要。從生態上推進 “系統級嵌入”,通過標準化接口解決權限爭議,同時以端側數據處理,解決數據隱私問題。
同時需要看到,努比亞背后的中興不算手機大廠,其名不見經傳的小牛語音助理更容易從系統層面換做豆包AI助理。做個不恰當的比喻,豆包之于努比亞,如同汽車領域的華為之于賽力斯。豆包是努比亞的加分項,而對于其他大廠而言,則存在失去“靈魂”的焦慮。
豆包與手機廠商深度合作的挑戰,或許并不是技術能力,而是商業與組織能力。
在手機大廠眼中,豆包,乃至字節都只是“第三方服務商”,而涉及到硬件適配與底層權限調用,將讓事情變得復雜起來。引入豆包都將讓手機廠商自研AI助理陷入尷尬的境地,這也導致手機大廠與豆包存在一定的排異反應。
誰是蘇,誰是伊麗莎白?
“在AI和游戲面前,手機性能永不過剩。”
一家頭部手機廠商高級副總裁此前談及端側AI部署時提到,手機廠商除了要保持流暢運轉,還需要考慮能效、散熱等性能發揮到極致。畢竟手機端側AI部署才剛剛起步,對于如何做好底層內存占用與調用,各手機廠商都還在摸索之中。
言下之意,到底如何開展,手機廠商們還在獨自摸索之中。
在談及第三方合作時,上述表達看似開放,實則暗藏深意。“我們跟很多三方廠商都有合作,他們是非常樂意去成就這件事情,甚至有很多服務廠商主動找我們,我們一直推動的生態都是希望是雙方共贏的。”
一年時間下來,幾乎所有手機廠商現有的AI應用并沒有結構性變化,而無法像豆包與努比亞一樣,真正讓AI助手來“完成動作”。
![]()
OPPO是幾家廠商中步子邁得最大的一家。此前收購波形智能,且一并吸納了核心高管CEO姜昱辰、COO余騰、CTO周王春澍,除了迅速建立起文本處理能力,或多或少也看到了后者鼓吹的LPA(Life-long Personalized AI,長期個性化AI),在個性化服務上的前景。
盡管不少手機廠商在去年和今年,都曾用自研的AI助手點一杯咖啡,這背后其實源于工程化。在豆包手機助手演示視頻的最后一部分可以看到,其在復雜的出國場景下,如何根據用戶個性化需求,完成跨平臺的復雜動作。
在社交媒體收藏巴黎餐廳,并在地圖軟件上標記。基于記憶數據,豆包根據需求,在行程中插入了奧賽美術館的梵高展。最后再到OTA平臺,完成了訂票動作。
另一個更現實的問題是,榮米OV都有一支規模龐大的AI手機助手開發團隊,與豆包的合作都將改變其在內部的位置。
大模型時代,到底是硬件定義軟件,還是軟件定義硬件,關于這個問題至今眾說紛紜。
但在去年大模型公司和硬件廠商達成的默契是,“雙方一定要合作”,即針對端側模型在硬件基礎上,進行一體式的優化。蘋果和OpenAI拿出了一個范本,涉及隱私部分調取在本地,算力推理部分在云端。
既非端側大模型,也不是純硬件,字節靠豆包AI助手走出了第三條路。這條路以“AI頂流”豆包這款產品為背書,通過以“類Siri”的模式部署到手機端,以此來帶動合作方手機和字節旗下耳機的銷量。
什么是“類Siri”的模式?豆包AI助手在手機端承擔著喚起所有功能的管家角色,這不同于此前大火的Computer Use功能,因為Computer Use更側重于讓大模型直接操控操作系統或應用程序,實現“所見即控”的自動化任務執行。
豆包的“類Siri”模式本質上是AI助手的生態化延伸,它并不追求直接介入系統底層操控,而是作為用戶與手機功能、內容服務、物聯網設備之間的智能調度中樞。
字節的第三條路,本質上是以軟件體驗為杠桿,撬動硬件市場的增量需求。當用戶因豆包的便捷交互而選擇特定手機或耳機時,模型的價值已不再局限于技術本身,而是成為了消費決策的關鍵變量。接下來,這有可能成為新的趨勢,軟件與硬件的邊界正在從“誰定義誰”轉向“共同進化”。
入口再定義
“豆包AI助手”所隱喻的內涵,正在被字節悄悄放大。
在我們的既有印象中,豆包是一款AI應用,而不是Siri。今年是AI to C大年,各類面向C端的AI助手層出不窮,形態各異。產品多以兩種方式出現,一種是靈光、千問此類的獨立應用;另一種是元寶,嵌入微信生態之內的輕量化路徑。
螞蟻靈光團隊在回顧產品誕生歷程中提到一點觀察,“沿著提高信息傳遞效率的產品主軸探索,我們發現模型寫代碼、調動各種工具,確實到了一個不僅能夠降本增效,還具備生成用戶消費級內容的臨界點”。
豆包作為一款AI應用,深受字節產品邏輯影響。一個細節是,為了成為一款低門檻的通用助手,豆包從一開始就把語音視為一種重要的輸入方式,到幾乎成為所有嘗試中雷打不動的功能。我們觀察到,語音的邏輯再次復用到了豆包輸入法上。對比微信輸入法,豆包把語音輸入放置在了顯眼的位置。
![]()
某大廠AI應用團隊告訴我們,現在的AI產品各有主張,比如豆包的語音打電話功能、DeepSeek的推理功能,這導致新產品問世只能在豆包以外的側面生存。
同樣是投流之戰,Kimi打的是知名度和資本市場估值,字節則將其視為大型A、B測試訓練場。哪些功能屬于高頻,哪些屬于技術剛需,用Token調取量一對比一目了然。
QuestMobile數據顯示,2025年10月,AI原生應用中,豆包最高,DAU為5410萬。DAU大戰落下帷幕,隨著豆包功能的向外延展,Kimi、MiniMax等產品離一款通用AI助手的標準越來越遠,轉而走向了更聚焦的垂直Agent。
然而,這場戰事似乎尚未結束,在最近有了新的名字——“入口之爭”。阿里的千問是新發起者,就在上周剛完成了與夸克應用、瀏覽器,以及智能眼鏡的深度融合。
眼下,字節轉身殺了個回馬槍,直指手機廠商腹地,提出了另一種“入口”形態。
如果說千問整合的是阿里生態入口,那么字節想以豆包打通的則是,除了蘋果、鴻蒙封閉生態外的手機廠商入口。此前,諸如面壁智能、階躍星辰一些大模型創業公司也有一些嘗試,但囿于自身資源,無法跟手機廠商完成深度綁定。
豆包手機助手僅是字節降落端側的“先頭兵”,其背后是豆包為統一品牌下的大模型技術能力、產品能力和用戶場景洞察能力。字節的野心可能是讓豆包成為手機廠商的標準化Siri,實現“所見即可問,所言即可為”。
在短期內或許會遇到挑戰。一方面受限于大模型技術的不確定性,演示場景無法保證百分百復現,實際可用性與預期仍有差距;另一方面,豆包AI助手想要成為“靈魂”,需要與不同廠商的操作系統進行更深度的、定制化的整合,這將需要時間和工程投入。
更長遠來看,如何處理好與安卓手機廠商之間,既合作又博弈的復雜生態關系變得尤為重要。
字節“不造手機,卻想定義手機靈魂”的戰略,正將這場入口之爭推向一個更微妙,也更關鍵的階段。互聯網巨頭與終端廠商在這場AI重構一切的變革面前,都會思考“You are one”。
這句來自《某種物質》的隱喻,既兜售著軟硬一體的本源,也暗藏著無可避免的矛盾。
微信號|TMTweb
公眾號|光子星球
別忘了掃碼關注我們!





京公網安備 11011402013531號