12月9日消息,想象一下,你只需要對著手機說一句“下個月去巴黎,幫我把收藏的餐廳標在地圖上,看看哪天有展覽并訂票”,手機就能自動理解意圖、拆解任務,在多個應用間跳轉、查詢、標記、比價、下單,一氣呵成。這就是豆包手機助手描繪的未來圖景——一個住在你手機里的“超級管家”。
2025年12月初,這款由字節(jié)跳動推出并與中興手機深度合作的AI助手技術預覽版一經(jīng)發(fā)布便引發(fā)轟動。它代表了一種新的AI落地形態(tài):從被動的語音應答工具,進化為能“看見”屏幕、能“動手”操作、能自主完成復雜任務的智能體(Agent)。

然而,這位能力超凡的“管家”剛一亮相,就迅速撞上了一堵無形的“墻”。微信賬號異常退出、支付寶提示登錄環(huán)境風險、部分用戶甚至因此被禁止登錄或支付。這些現(xiàn)象并非偶然的技術故障,而是觸發(fā)了互聯(lián)網(wǎng)核心應用嚴格的安全風控機制。與此同時,關于其獲取高危系統(tǒng)權限(INJECT_EVENTS)可能侵犯隱私的質疑也甚囂塵上。
有科技圈內(nèi)的大佬們認為,豆包手機助手的打法會沖垮互聯(lián)網(wǎng)大廠的護城河,這場“戰(zhàn)爭”的核心是手機桌面的控制權爭奪等等。從長遠看,這些預測可能都對。
但是,就當前和短期來看,豆包手機助手遭遇的這些問題并非單純的商業(yè)競爭摩擦,而是觸及了數(shù)字安全的根本。
這場沖突的實質,是豆包助手所代表的“高度自主的AI代理”模式,與當下已成為信息安全基石的 “零信任”(Zero Trust)原則,在底層邏輯上發(fā)生了根本性的碰撞。
本文旨在深入剖析這一矛盾,并探討通往未來的可能路徑。
豆包手機助手,模擬人的AI“執(zhí)行官”
豆包手機助手之所以引發(fā)如此大的關注,在于它實現(xiàn)了對傳統(tǒng)語音助手的顛覆性跨越。它不再僅僅是一個“問答機”,而是一個具有“執(zhí)行力”的“操作者”。
綜合豆包手機助手官方公布的、首批努比亞 M153 豆包手機助手使用者的心得,其核心能力可以概括為以下幾點:
深度的系統(tǒng)集成與感知能力:豆包助手并非普通應用,而是通過與手機廠商(如中興)的合作,深度融入了操作系統(tǒng)層面。這使得它能夠獲得更高級別的權限,不僅能夠聽取語音指令,更能“看到”屏幕上的內(nèi)容(視覺感知),理解當前的應用界面和用戶狀態(tài),從而做出精準的上下文判斷。
跨應用、多步驟的自主操作:這是其“智能體”能力的集中體現(xiàn)。助手能夠將用戶的一句復雜指令(如“全平臺比價下單”),自動拆解為一系列子任務:打開不同購物App、搜索商品、對比價格和規(guī)格、領取優(yōu)惠券,最后將選定的商品加入購物車,等待用戶最終確認支付。它甚至能處理“查詢播客更新并加入播放列表,同時遠程打開汽車前備箱、預訂餐廳、在飛書上提交請假申請”這類多線并行的復雜指令。
依賴系統(tǒng)級權限的模擬交互:實現(xiàn)上述自動化的關鍵,在于獲取了Android系統(tǒng)的`INJECT_EVENTS`(注入事件)權限或類似的高階權限。這相當于操作系統(tǒng)賦予了助手一個“萬能手指”,使其能夠模擬人類的點擊、滑動、輸入等所有觸屏操作,從而“穿透”不同應用之間的壁壘,像真正的人一樣流暢操作手機。豆包官方強調,此權限需要用戶主動授權,并在涉及支付、授權彈窗等敏感環(huán)節(jié)時,會暫停任務交由用戶手動處理。
本質上,豆包手機助手將大模型的認知決策能力與系統(tǒng)級的自動化操作能力相結合,旨在成為用戶數(shù)字世界的“代理人”。這無疑代表著AI應用的一個激動人心的未來方向,被譽為“AIOS(AI操作系統(tǒng))照進現(xiàn)實”。
安全隱患的冰山一角
盡管愿景誘人,但豆包手機助手甫一問世便遭遇的現(xiàn)實阻力,揭示出其模式內(nèi)生的、不可回避的安全風險。這些問題并非單純的商業(yè)競爭摩擦,而是觸及了數(shù)字安全的根本。
首先,傳統(tǒng)應用權限是“一把鑰匙開一把鎖”,例如地圖App獲取位置權限。但`INJECT_EVENTS`這類系統(tǒng)級權限,如同拿到了整棟大樓的“萬能鑰匙”或“總控權限”。一旦獲得,助手理論上可以訪問和操作設備上任何應用內(nèi)的任何數(shù)據(jù),包括聊天記錄、銀行賬戶、身份信息等。這種權限的集中和泛化,極大地擴大了潛在的攻擊面。
其次,當AI成為實際操作的主體時,行為責任變得模糊。AI的操作速度遠超人類,且決策過程可能不透明。用戶可能在“授權一次,托管一切”后,失去對設備操作的直接感知和控制。更危險的是,此類技術已被黑產(chǎn)盯上,利用類似權限進行自動化欺詐、搶票等非法活動,而豆包助手的高度擬人化操作,使得應用方更難區(qū)分這是“善意的AI管家”還是“惡意的自動化腳本”。
再者,豆包助手的操作模式,直接挑戰(zhàn)了眾多關鍵應用(尤其是金融、社交類應用)自行建立的安全邊界和風控體系。例如,微信的《軟件許可及服務協(xié)議》明確禁止通過非騰訊授權的第三方工具進行自動化登錄和操作。銀行和支付類App更是將任何異常或非典型的操作行為視為高風險。因此,微信、支付寶等應用將其攔截,并非針對某一家公司,而是出于保護自身生態(tài)和用戶安全的底線原則。豆包助手演示中出現(xiàn)的“自動刷視頻領金幣”、“代打游戲”等場景,也預示著它可能干擾甚至破壞現(xiàn)有互聯(lián)網(wǎng)基于用戶注意力和交互設計的商業(yè)模式。
這些隱患并非杞人憂天,而是AI智能體獲得強大“行動力”后必然帶來的伴生問題。它們恰好與另一種日益成為共識的安全哲學“零信任”所警惕和防范的風險點高度吻合。
萬能代理vs永不信任 底層邏輯的碰撞
“零信任”并非某一項具體技術,而是一種安全理念和框架。其核心原則可歸納為三點:顯式驗證、最小權限、假定數(shù)據(jù)泄露。
將豆包手機助手的運行邏輯與這三條原則進行對比,便能清晰看到二者間深刻的矛盾(如下表):

用一個比喻來說:零信任理念下的每個應用(如銀行App)都是一個需要獨立驗明身份、核查事由才能進入的獨立金庫。而豆包手機助手希望獲得用戶授予的“超級委托書”,讓自己可以代表用戶進入所有金庫辦理業(yè)務。問題是,各個金庫的擁有者(應用平臺)是否有權拒絕這個持有“超級委托書”但行為模式像機器人的“代理人”?這正是當前法律和技術上的灰色地帶。
矛盾已然顯現(xiàn),但趨勢不可阻擋。


抖音集團副總裁李亮在其微博發(fā)文,“距離實現(xiàn)這一切的路已經(jīng)很近了,但又困難重重。”、“AI帶來的變革是真實存在的,用戶的需求也是真實存在的。豆包和中興的探索是一個開始,不論這次是不是會成功,但AI一定是未來。”
AI智能體提升數(shù)字生活效率的方向是正確的,關鍵不在于扼殺創(chuàng)新,而在于如何為其設立合理的“交通規(guī)則”,在創(chuàng)新與安全之間找到平衡點。要讓用戶真正安心使用。
如何破局?
事實上,豆包手機助手本身也將自己定位在“技術預覽版”、“探索產(chǎn)品”的位置上。
12月3日,豆包手機助手官方微信在發(fā)布“關于豆包手機助手,說幾個大家關心的問題”時指出:豆包手機助手此次發(fā)布的是一個“技術預覽版”,是一款面向行業(yè)、AI技術愛好者的探索產(chǎn)品,部分功能和交互比較創(chuàng)新,目前也沒有明確的行業(yè)共識。在官方視頻和銷售網(wǎng)站上明確強調,這款產(chǎn)品目前并不面向普通的消費者。

隨著豆包手機助手試用體驗的進一步深入、多方聲音的陸續(xù)發(fā)出,12月5日豆包手機助手官方發(fā)布“關于調整AI操作手機能力的說明”,對AI操作手機的能力做一些規(guī)范化調整,包括:限制刷分、刷激勵的使用場景,進一步限制金融類應用的使用,限制部分游戲類使用場景。

對于AI手機助手這類AI agent可能帶來的風險,清華大學和對外經(jīng)濟貿(mào)易大學的專家指出,未來智能體的操作可能需要“雙重授權”甚至“多重授權”。即,除了用戶授權給AI助手,還需要某種形式的被操作應用平臺的授權或認可。這并非意味著應用平臺可以隨意拒絕,而是需要建立一套標準化的、透明的授權協(xié)議和API接口,讓符合安全規(guī)范的智能體能夠被識別和接納,而非一律被當作“外掛”攔截。
F5 亞太區(qū)首席技術官Mohan Veloo指出,AI 智能體的高速自主能力要求將API安全嵌入業(yè)務運營底座。這意味著需要將治理、可視性及策略執(zhí)行直接整合至API工作流,確保每一次無論是人為還是機器發(fā)起的交互均能經(jīng)過實時認證、授權與監(jiān)控。
豆包官方承諾屏幕內(nèi)容不上傳云端、數(shù)據(jù)本地留存,這是正確的方向。未來應結合差分隱私、聯(lián)邦學習、可信執(zhí)行環(huán)境(TEE)等技術,確保最敏感的隱私數(shù)據(jù)在本地被安全處理,最大限度地減少數(shù)據(jù)暴露的風險。
無論如何,豆包手機助手與零信任安全模型的碰撞,是一場關于未來數(shù)字世界治理規(guī)則的提前預演。它尖銳地提出了一個時代性議題:當AI不再只是參謀,而是被賦予了執(zhí)行的“手”,我們?nèi)绾卧谙硎芷鋷淼臉O致便利的同時,守護好安全與隱私的底線?
這道題的答案,不會是簡單的“支持”或“反對”。它要求我們超越“人—機—平臺”之間零和博弈的舊思維,共同構想一個共生共贏的新圖景。這需要技術創(chuàng)新者保持敬畏與開放,主動將安全設計融入產(chǎn)品基因;需要平臺企業(yè)從純粹的防御轉向建設性的合作,共同制定開放標準;需要監(jiān)管者和法律界以敏捷、審慎的態(tài)度,為新技術劃定合理的運行空間;最終,也需要每一位用戶提升數(shù)字素養(yǎng),理解自己授權的分量。





京公網(wǎng)安備 11011402013531號