讓“AI助手”向“AI伙伴”進階。
2025年,AI硬件迎來了真正意義上的元年。
經過2024年GPT-4o與Gemini 1.5的技術升級,多模態大模型具備了從理論研究走向應用落地的可能。AI不再局限于文本生成或語音問答,還能夠看懂畫面、感知環境、主動響應。AI硬件終于不必只是極客群體的“玩具”,而是能真正進入大部分人的生活。也因此,這一年,AI硬件幾乎以爆發式的頻率登上舞臺。
從錄音筆、攝像機、音箱,再到眼鏡、戒指、項鏈,每一件都在被重新定義:有人追求即時記錄的效率,有人探索更擬人、更沉浸的交互,也有人看重情緒與語義的連接。但無論形態如何,這些都是AI無限貼近人類的嘗試。
這背后更宏大的思考是:AI應該以怎樣的形態融入物理世界?
就在這樣的時間點,11月13日,小度在世界大會智能硬件分論壇上推出了全新多模態AI智能助手——超能小度。不同于多數AI硬件創業公司押注單一場景,小度選擇全面重塑,將其全系、全量、全生態產品,都進行了一輪升級。
![]()
其中,搭載了超能小度的硬件新品——小度AI眼鏡Pro與小度智能攝像機C1200三攝版和C800視頻通話版、小度智能音箱Fun等也在論壇一同亮相。
小度想搶占的,是AI與現實世界的交界。“小度從誕生之日起,始終追求的是人機交互的革命。而超能小度正是這一使命的全新載體。”小度科技CEO李瑩在現場表示。
01
從助手到伙伴,小度的超能進化
如果只把AI當作硬件的附加價值,那無論硬件形態如何變化、軟件功能如何豐富,本質都只是技術的堆疊;只有當AI成為驅動硬件交互變革的原生推動力,甚至將其重新定義,才有可能推動“下一代人機關系”的真正到來。
當全球硬件廠商大多在比拼“如何把AI助手更好地植入設備”時,小度選擇的是,聚焦AI助手本身在“感知、學習、記憶”的能力進化,并以此反推硬件產品創新。
超能小度的發布,正是這一邏輯的極致體現。
在原有語音交互能力之上,作為多模態AI智能助手,它還具備了圖像、視頻等視覺信息的處理能力,甚至能夠結合對周邊環境信息的感知,進行復雜的推理與規劃。
發布會現場的一個案例,令人尤為印象深刻——“智能尋物”:當你對著攝像機問一句“我把遙控器放哪兒了”,超能小度就會先掃描當前屋內的實時畫面;如果沒有找到,還會自動回溯過去24小時、甚至是更長時間段內的歷史畫面,來定位遙控器最后一次出現的時間和位置,并展示當時的視頻記錄。
雖然解決的是“找不到遙控器”這個日常難題,但這個設想背后的意義,卻遠不止于此。
從技術層面來說,這意味著,AI不僅要能“看見”和“看清”物體,更得能“看懂”空間和時序關系,從而構建起對真實世界多維的、動態的映射——而這也是大模型目前面臨的主要挑戰之一。
小度將此次超能小度的升級,總結為三大進化:
1.從單點響應到全局理解:不再局限于單次指令執行,而是能夠進行上下文深度理解,并結合時間、空間、人物、行為等綜合判斷,實現更加全面、多維的感知決策。
2.從被動智能到主動智能:不同于過去“你呼我應”“你問我答”的交互模式,而是主動理解、分析、甚至是預判用戶需求,并提供解決方案。
3.個性化記憶強化:不僅能記住習慣和偏好,還能洞察語氣與情緒,察言觀色、想你所想、懂你所需,讓人機關系真正從“工具”邁向“伙伴”。
現場李瑩還宣布,超能小度的全系、全量、全生態上線,除了覆蓋包括小度AI眼鏡、小度智能攝像機、小度智能音箱Fun等新品外,其數千萬臺已售設備也都將可以免費升級,實現更加自然、深度和貼心的人機交互體驗,讓“AI助手”真正完成向“AI伙伴”的跨越進階。
![]()
02
當AI伙伴走進物理世界
發布會上,已全面搭載超能小度的多款硬件新品,也成為了全場焦點。
以小度AI眼鏡為例,據介紹,其搭載高通驍龍AR1芯片,配備索尼1200萬像素109°超廣角鏡頭,支持4K照片和1440p視頻拍攝,并內置EIS智能防抖;采用開放式防漏音雙揚聲器和五麥克風陣列協同收聲設計,結合逆聲場定向聲學系統、自研ENC通話降噪算法等,可有效降低通話、聽歌和語音交互場景下的噪音干擾。
續航方面,綜合模式下單次連續使用時長可達約7.5小時,搭配隨附的智能充電盒,則能夠達到約68小時,確保日常使用無憂。
![]()
此外在外觀和佩戴體驗上,小度AI眼鏡Pro機身僅重39克。現場展示中,可以看到,除了有波士頓、貓眼兩款框型外,小度還推出了墨鏡和光致變色鏡片可供選擇,并配備可調節的軟硅膠材質鼻托,在時尚感、使用場景和臉型適配等方面,都做了優化。
當然,AI眼鏡市場競爭火熱,拼“硬功夫”,更拼“軟實力”。
作為國內較早布局該領域的廠商之一,小度通過升級多模態智能,也在其AI眼鏡的實際功能體驗上,展現出軟硬結合下“1+1>2”的不俗效果。
比如,當你不方便掏手機,又需要記錄停車位或小區物業通知時,只需跟小度說一句“幫我記一下”,眼鏡便會自動拍照、解析并生成備忘,讓你可以隨時詢問“我的車停哪了”“明天幾點會停水”,甚至一鍵撥打物業電話,真正實現了“隨看隨記,隨問隨得”。
在辦公場景中,AI的作用更被進一步放大:眼鏡的“AI會議紀要”功能,在常規的錄音轉寫、內容總結的基礎上,不僅可以拍照記錄下重要的板書、PPT等會議資料,自動匹配至紀要的對應位置,還支持進一步洞察發言人意圖和分析潛在爭議點等等,并生成溝通策略、后續推進指引、流程提效等多種優化建議。
據悉,該功能也將在今年12月正式上線。
此外,小度與網易云音樂聯合打造的“氛圍歌單”功能,還讓AI擁有了更柔性的表達。當你說“給我來首應景的歌”,眼鏡就會根據眼前的畫面,為你生成專屬的BGM——無論是黃昏街頭的光影,還是山頂俯瞰的風景,都能被AI捕捉并譜寫成一段情緒的旋律。
![]()
類似的場景不勝枚舉,通過眼鏡這個隨身載體,超能小度融入了我們日常的每一刻。
李瑩提到,如果說AI眼鏡作為我們感官的延伸,實現了“第一視角智能”,智能攝像機對周邊環境的感知理解,則將開啟另一種全新的——“上帝視角智能”。
此次小度推出的兩款智能攝像機:
一款是帶有屏幕的視頻通話版本,主打家里有老人和孩子的家庭,支持便捷、流暢的雙向微信視頻通話;而最新發布的、搭載三個攝像頭的小度智能攝像機C1200,通過云臺長+短焦鏡頭和固定超廣角鏡頭的組合設計,不僅可以雙畫面聯動,更好地追蹤移動目標,10倍光學混合變焦還能夠實現高清的細節捕捉,也更為適合有寵人群。
![]()
同樣基于超能小度的多模態能力加持,小度智能攝像機還打造了“AI隨心看護”功能,能夠識別人、寵等特定對象的具體行為,在理解畫面語義的基礎上,主動進行干預——比如孩子學習姿勢異常時主動語音提醒,寵物拆家時出動掃地機器人進行威懾等等。
![]()
可見,如今Chatbot式的一問一答,已很難滿足人們對更高層次智能應用的想像。
讓無形的智能,走進真實的生活,理解我們當下所經歷的事情,主動提供幫助和陪伴,或許才是更加值得期待的AI形態。
03
多模態不是終點
從十年前的Siri到智能音箱時代的小度,人們一直在嘗試用對話打開智能的入口——語音交互幾乎是所有智能硬件的標配,帶來了便利,卻始終難以成為剛需。
近兩年來,隨著多模態技術的快速發展,大模型競速的焦點也在迅速轉向:OpenAI GPT-4o首次用一個模型實現文本、圖像、音頻、視頻的實時多模態理解和生成;Google基于Gemini的Project Astra智能體,可以通過攝像頭和麥克風進行觀察并理解周圍環境,且具備超長上下文記憶能力;meta在其跟Ray-Ban合作推出的智能眼鏡中,也在探索加入包括視覺問答在內的更多多模態AI應用。
在這個行業敘事下,小度此次“超能”進化,其實選擇了一條更漫長、但也更能給用戶帶來長期價值的路徑:從語音、視覺到情緒,從理解指令到理解人,真正實現對“AI助手”的重新定義。
正如李瑩在現場所說,“AI是賦予智能硬件靈魂、開啟全新想象空間的核心所在”——從智能音箱、智能屏、閨蜜機、健身鏡、學習機,再到如今的AI眼鏡、智能攝像機,小度每一次的產品演進,都清晰地指向這同一個目標。
如果設備只是“被放在那里”,卻無法被真正使用,那么AI的價值就無從體現。反過來,若AI能夠借由硬件,和使用者形成交互與陪伴,那才是人與科技共生的起點。
市場趨勢也在印證這這種思路:Global Market Insights報告指出,2024年全球AI硬件市場規模約為59億美元,預計2025年將增長至668億美元,且預計到2034年將達約2963億美元,年復合增長率約18%;Coherent Market Insights報告中,“On-Device AI”市場(即可穿戴終端設備上運行AI的部分)在2025年估算為266.1億美元,預計到2032年將擴展至1240.7億美元,年復合增長率約24.6%。
面向行業的快速增長,小度通過全新多模態AI助手的發布與新老設備的普惠升級,也進一步明確了其“以AI為核心、以硬件為載體”的戰略卡位。
根據官方數據,目前小度自有品牌產品的滲透率已經達到5400萬戶,并且還在不斷增長中。同時,超能小度也將以智能引擎的方式開放出去,讓酒店、養老等更多行業伙伴也能實現能力升級,成為各類廠商可以調用的AI能力底座。“希望大家一起為用戶創造更智能、便捷、人性化的體驗。”李瑩說道。
站在2025年的節點回望,從大家熟知的語音助手,再到如今的多模態AI助手,超能小度的進化,不僅僅是技術的迭代升級,更在重塑人、機器與世界的連接。
當語言、圖像、聲音的壁壘終于被打破——機器從被動的工具,蛻變為能聽、能看、能說、能思的數字伙伴,這場關乎人機交互未來形態的革命,才剛剛開始。





京公網安備 11011402013531號