本文時代周報 作者:朱成呈
小米MiMo大模型負責人羅福莉的首次公開亮相,迅速在圈內(nèi)掀起一波熱度。
12月17日,在小米“人車家全生態(tài)大會”上,羅福莉以小米高管身份站到前臺,發(fā)表了一場近乎學術(shù)范的演講。她的演講重心不在參數(shù),也不在秀指標,而是通過拋出一個個判斷,從技術(shù)層面表達了一系列思考。
羅福莉的表現(xiàn)之所以受矚目,與“AI天才少女”的標簽不無關(guān)系。她1995年出生于四川宜賓,本科就讀于北京師范大學計算機專業(yè),碩士畢業(yè)于北京大學計算語言學研究所計算語言學專業(yè)。2019年,因在人工智能領域頂級國際會議ACL上發(fā)表8篇論文引發(fā)外界關(guān)注。
在入職阿里達摩院和DeepSeek兩段職業(yè)經(jīng)歷后,羅福莉與小米創(chuàng)始人雷軍關(guān)聯(lián)在了一起。此前有報道稱,雷軍開出千萬年薪希望邀請羅福莉加入從事大模型研究,消息一度登上熱搜。今年11月,羅福莉通過朋友圈官宣,自己已加入小米。
羅福莉認為,當代的智能體必須具備一種高效的溝通語言,而這種語言主要體現(xiàn)在代碼能力和工具調(diào)用能力上。智能體之間的溝通帶寬其實非常低,需要思考如何去加速這種帶寬。這就要求模型具備非常高的推理效率,因此要圍繞推理效率,重新設計模型結(jié)構(gòu)。
她表示,下一代智能體至少需要具備兩個潛能:第一,它要從“回答問題”轉(zhuǎn)向“完成任務”;第二,它必須具備與世界交互的能力。
這一表態(tài),與小米正在鋪開的大模型版圖形成呼應。今年以來,小米幾乎以月為單位推進模型發(fā)布:從4月的推理模型MiMo,到5月的多模態(tài)MiMo-VL,9月的端到端語音MiMo-Audio,再到11月面向家庭場景的Miloco。
截至今年第三季度,小米AIoT平臺全球連接設備數(shù)首次突破10億,達到10.4億臺。羅福莉的加入,意味著小米開始試圖回答一個更長期的問題:在“人、車、家”生態(tài)中,模型究竟該如何理解世界,并持續(xù)參與其中。
而首秀之后,雷軍留給羅福莉的考題也剛開始。
對“物理AI”興趣濃厚
羅福莉身上的流量色彩無疑很明顯,但真正值得關(guān)注的,是她入職小米后的研究方向。
在官宣入職尚不足10天,MiMo團隊的首篇論文便已公開。論文中,羅福莉作為團隊負責人擔任核心作者,小米智駕團隊首席科學家陳龍出任項目負責人。研究提出并開源了跨具身基座模型MiMo-Embodied,嘗試打通自動駕駛與具身智能兩個領域。
這并非臨時起意,在加入小米之初,羅福莉已表達對“物理 AI”的興趣。她在朋友圈表示,“智能終將從語言邁向物理世界。我正在XiaomiMiMo,和一群富有創(chuàng)造力、才華橫溢且真誠熱愛的研究員,致力于構(gòu)建這樣的未來,全力奔赴我們心目中的AGI!”
按照英偉達官網(wǎng)的解釋,物理AI是指使用運動技能理解現(xiàn)實世界并與之進行交互的模型,它們通常封裝在機器人或自動駕駛汽車等自主機器中。羅福莉在演講中給出了更直接的表述:AI進化的下一個關(guān)鍵點,一定是能夠與真實環(huán)境持續(xù)交互的物理模型。真正的智能不是從文本中“讀出來”,而是要在交互中“活出來”。
這一判斷,恰好指向小米當前最核心的“人、車、家”生態(tài)。在這一體系中,AI不再是獨立存在的能力模塊,而必須嵌入具體業(yè)務場景,承擔感知、決策與執(zhí)行的角色。無論是智能駕駛,還是具身智能,都可能成為小米大模型從“認知工具”走向“行動主體”的關(guān)鍵落點。
值得注意的是,在12月16日晚,小米公布了MiMo-V2-Flash開源MoE模型,總參數(shù)量309B,活躍參數(shù)量15B。羅福莉表示,MiMo-V2-Flash實現(xiàn)了低成本、高速度,已初步具備模擬世界的能力。
“小米方案”打破設備局限?
按照盧偉冰披露的時間表,小米自研的MiMo系列已覆蓋推理、視覺、多模態(tài)、音頻與具身等多個層級。包括推理大模型MiMo-7B,視覺推理大模型MiMo-VL,原生端到端音頻生成模型MiMo-Audio,端側(cè)視覺語言大模型MiMo-VL-Miloco,具身大模型MiMo-Embodied。
其中,MiMo-VL-Miloco大模型顯然是為智能家居服務。11月14日,小米推出智能家居未來探索方案Xiaomi Miloco。試圖讓智能家居設備從“被動響應指令”,走向“主動理解與服務”。
“AI會打破設備局限,甚至未來桌椅板凳也可以融入到智能家居系統(tǒng)”。資深互聯(lián)網(wǎng)觀察家丁道師向時代周報記者表示,“像小米Miloco這類方案,能打破設備孤島,不用你發(fā)指令,靠本地大模型就能自動感知需求、切換場景,還能保護隱私。”丁道師指出,小米Miloco會讓智能家居從“聽指揮”變“主動服務”。
長期以來,智能家居的核心瓶頸并不在設備數(shù)量,而在交互方式。多數(shù)系統(tǒng)依賴規(guī)則引擎,用戶需要手動設定觸發(fā)條件與執(zhí)行邏輯:溫度多少度、時間幾點、哪個傳感器先觸發(fā)。這套機制在工程上穩(wěn)定,卻極度依賴用戶“提前想清楚一切”,交互體驗因此顯得機械而碎片化。即便是熟悉智能家居體系的極客用戶,也未必愿意長期維護復雜規(guī)則。
![]()
羅福莉的首次公開亮相 時代周報記者 拍攝
國金證券研報表示,Miloco核心優(yōu)勢在于,用戶可通過口語化表達需求,由系統(tǒng)自動調(diào)用工具創(chuàng)建智能規(guī)則,無需手動設置復雜觸發(fā)條件;智能層面,依托自研的Xiaomi MiMo-VL-Miloco-7B 端側(cè)視覺語言大模型,結(jié)合家庭攝像頭的實時視覺數(shù)據(jù),讓智能家居從“單一條件觸發(fā)”升級到“多維度場景感知”。
事實上,有很多品牌在布局家庭智能。丁道師表示,華為、三星、美的、歐瑞博、Rokid都有Home AI概念。以后用戶使用智能家居,可能連APP都不用點開,回家燈自己亮、空調(diào)自己調(diào),甚至能根據(jù)用戶狀態(tài)判斷要不要放首舒緩的歌。
GKURC產(chǎn)經(jīng)智庫首席分析師丁少將則認為,Miloco這類系統(tǒng)將改變當前以APP為中心的碎片化操控模式,轉(zhuǎn)向以用戶意圖為核心的場景化自動執(zhí)行。
丁少將向時代周報記者表示,智能家居領域會出現(xiàn)類似AI手機的集中式操作系統(tǒng)。小米的Miloco概念已展現(xiàn)出這種趨勢,通過本地化AI中樞統(tǒng)一調(diào)度跨品牌設備,實現(xiàn)主動服務和無感交互。不過關(guān)鍵在于能否打破品牌生態(tài)壁壘,建立統(tǒng)一的協(xié)議標準。一旦實現(xiàn),智能家居將從“單點智能”躍升為真正自主決策的“空間智能體”,重新定義人、設備與環(huán)境的關(guān)系。





京公網(wǎng)安備 11011402013531號