壹番財經 鄭亦久
12月的第一天,字節跳動旗下的豆包突然推出的手機助手測試版,瞬間成為焦點。
它并不是單純豆包AI的升級版,而是一套試圖改變手機使用方式的系統級AI。它讓模型能夠像人一樣刷手機,從而以一種更高維度的方式接管用戶的意圖。
豆包手機助手演示視頻
這種技術方向本身無疑是明確的,在移動端逐漸進入AI原生時代的當下,系統層面的會從傳統的點按界面,逐漸轉向自然語言理解與高度自動化執行。
然而,當這套看似未來感十足的路線真正落地時,一個不難發現的結構性障礙也隨之暴露出來國產手機系統和軟件生態深度權限遠比想象中更難觸達,而豆包的愿景又高度依賴這種軟硬件的權限自由。
從這個角度來看,豆包最終可能被國內復雜的生態結構推著走向自研硬件,而不是停留在做一個助手應用的層面。
01 怕玩手機累著,讓豆包來幫你刷
豆包手機助手在測試版中所呈現出的能力,明顯比市面絕大多數所謂的AI對話助手更為激進。
它基本是一套嘗試通過底層能力完成跨應用動作的系統級協作方案。通過理解用戶的意圖,并將這些意圖自動拆解成一連串操作指令,再由系統級AI直接執行。
如果從更宏觀的技術脈絡來看,豆包想做的,其實正是桌面端早已反復驗證過的代理(Agent)模式像是目前給出的演示,幫你電商比價、外賣下單、聊微信等等。
豆包手機助手演示視頻
當然在PC環境中,這種代理能夠借助相對開放的系統、窗口結構與權限體系,順利完成自動化任務,從出道即巔峰的Manus,到之后ChatGPT的代理,其實目前大廠都已經給出了穩定方案。
但手機作為一個封閉得多的生態,情況就完全不同了。不論蘋果還是安卓作為移動系統限制更強、應用之間的邊界更硬、可供調用的系統能力也更少。
桌面端代理能夠輕松實現的操作,一旦移植到手機上,立刻變成一系列需要深度系統權限才能完成的動作。
因此,豆包試圖在手機端復刻全局代理的企圖,難度實際上遠高于PC端的同類產品。它不僅要理解用戶的意圖,更要突破手機系統對跨應用操作的天然封鎖。像是讀取微信聊天界面這種功能,一旦被騰訊盯上,視為某種程度的隱私風險,那正式版是否還能使用,尚未可知。
豆包手機助手演示視頻
畢竟從目前的測試效果來看其試圖扮演的不再是一個語音助手,而是橫跨系統的AI操作系統。
這確實代表了未來手機交互的方向。然而,也正是這種對底層權限的高度依賴,讓豆包在現實中撞上了沉重的生態壁壘。
目前國內的頭部手機廠商幾乎都在打造某種程度上的AI原生系統。小米、華為、OPPO、vivo甚至蘋果無一例外,都通過系統級集成來強化自己的生態閉環。
在這樣的背景下,他們不可能讓一個來自外部的第三方助手直接介入底層,也不可能讓渡關鍵的權限。
和中興努比亞工程機的合作,本質上也揭示了同樣的問題:能夠與豆包深度合作的廠商,往往是生態規模有限的品牌,而真正具備影響力的頭部廠商,出于商業邏輯的天然對立,不可能放開權限。
因此,豆包現在處在一個尷尬的位置。一方面,它描繪的愿景合理且前沿;另一方面,它能否觸達這個愿景,卻并不取決于自身的技術,而取決于系統權限是否能被開放。
02 當被卡住脖子,豆包手機成唯一出路
當豆包選擇做這樣一款高度依賴系統級權限的助手時,它實際上已經接受了一個隱含前提:如果未來要讓這套能力成為真正的標準體驗,它必須能直達軟硬件生態的核心。
而能操作的方式只有兩種:說服一家頭部廠商開放系統權限,或者自己做能完全掌控的硬件。
第一條路幾乎沒有現實可能。所有頭部廠商都在打造自己所謂的AI OS,它們不會允許一個外部助手成為系統級入口。
AIOS架構
這意味著豆包不可能依靠現有廠商提供的底層權限來構建自己的核心能力。事實上大概任何AI廠商都很難指望依靠第三方的硬件來實現自己的全部需求與野心。
meta依托的是眼鏡,而阿里最近也推出了夸克AI眼鏡,其實多少也是在考慮尋求一個獨立的硬件入口。
這種趨勢在全球范圍內正在發生。無論是OpenAI的輕量設備路線,還是Google對Pixel系列的深度整合,本質都指向同一個方向:下一代AI智能硬件的核心不再是UI,而是AI邏輯。
Pixel 10的AI個人總結功能
在這個前提下,豆包要么成為別人系統的一部分,要么必須擁有自己的設備,并控制從硬件到OS的全鏈路。
對于豆包而言,問題大概不是要不要造硬件,而是不造硬件就無法實現愿景。事實上傳言字節開發智能眼鏡的消息由來已久,而收購多時的錘子硬件團隊顯然并不會完全閑著。
可以說在現有的產業格局下,這種操作層只有依附在它自己能掌控的硬件上,才有機會被完整實現。
豆包在發布手機助手時專門強調不造手機,但從技術方向、生態沖突到權限結構,未來打臉自己幾乎是必然會發生的事。





京公網安備 11011402013531號