本文時(shí)代周報(bào) 作者:朱成呈
小米MiMo大模型負(fù)責(zé)人羅福莉的首次公開亮相,迅速在圈內(nèi)掀起一波熱度。
12月17日,在小米“人車家全生態(tài)大會(huì)”上,羅福莉以小米高管身份站到前臺,發(fā)表了一場近乎學(xué)術(shù)范的演講。她的演講重心不在參數(shù),也不在秀指標(biāo),而是通過拋出一個(gè)個(gè)判斷,從技術(shù)層面表達(dá)了一系列思考。
羅福莉的表現(xiàn)之所以受矚目,與“AI天才少女”的標(biāo)簽不無關(guān)系。她1995年出生于四川宜賓,本科就讀于北京師范大學(xué)計(jì)算機(jī)專業(yè),碩士畢業(yè)于北京大學(xué)計(jì)算語言學(xué)研究所計(jì)算語言學(xué)專業(yè)。2019年,因在人工智能領(lǐng)域頂級國際會(huì)議ACL上發(fā)表8篇論文引發(fā)外界關(guān)注。
在入職阿里達(dá)摩院和DeepSeek兩段職業(yè)經(jīng)歷后,羅福莉與小米創(chuàng)始人雷軍關(guān)聯(lián)在了一起。此前有報(bào)道稱,雷軍開出千萬年薪希望邀請羅福莉加入從事大模型研究,消息一度登上熱搜。今年11月,羅福莉通過朋友圈官宣,自己已加入小米。
羅福莉認(rèn)為,當(dāng)代的智能體必須具備一種高效的溝通語言,而這種語言主要體現(xiàn)在代碼能力和工具調(diào)用能力上。智能體之間的溝通帶寬其實(shí)非常低,需要思考如何去加速這種帶寬。這就要求模型具備非常高的推理效率,因此要圍繞推理效率,重新設(shè)計(jì)模型結(jié)構(gòu)。
她表示,下一代智能體至少需要具備兩個(gè)潛能:第一,它要從“回答問題”轉(zhuǎn)向“完成任務(wù)”;第二,它必須具備與世界交互的能力。
這一表態(tài),與小米正在鋪開的大模型版圖形成呼應(yīng)。今年以來,小米幾乎以月為單位推進(jìn)模型發(fā)布:從4月的推理模型MiMo,到5月的多模態(tài)MiMo-VL,9月的端到端語音MiMo-Audio,再到11月面向家庭場景的Miloco。
截至今年第三季度,小米AIoT平臺全球連接設(shè)備數(shù)首次突破10億,達(dá)到10.4億臺。羅福莉的加入,意味著小米開始試圖回答一個(gè)更長期的問題:在“人、車、家”生態(tài)中,模型究竟該如何理解世界,并持續(xù)參與其中。
而首秀之后,雷軍留給羅福莉的考題也剛開始。
對“物理AI”興趣濃厚
羅福莉身上的流量色彩無疑很明顯,但真正值得關(guān)注的,是她入職小米后的研究方向。
在官宣入職尚不足10天,MiMo團(tuán)隊(duì)的首篇論文便已公開。論文中,羅福莉作為團(tuán)隊(duì)負(fù)責(zé)人擔(dān)任核心作者,小米智駕團(tuán)隊(duì)首席科學(xué)家陳龍出任項(xiàng)目負(fù)責(zé)人。研究提出并開源了跨具身基座模型MiMo-Embodied,嘗試打通自動(dòng)駕駛與具身智能兩個(gè)領(lǐng)域。
這并非臨時(shí)起意,在加入小米之初,羅福莉已表達(dá)對“物理 AI”的興趣。她在朋友圈表示,“智能終將從語言邁向物理世界。我正在XiaomiMiMo,和一群富有創(chuàng)造力、才華橫溢且真誠熱愛的研究員,致力于構(gòu)建這樣的未來,全力奔赴我們心目中的AGI!”
按照英偉達(dá)官網(wǎng)的解釋,物理AI是指使用運(yùn)動(dòng)技能理解現(xiàn)實(shí)世界并與之進(jìn)行交互的模型,它們通常封裝在機(jī)器人或自動(dòng)駕駛汽車等自主機(jī)器中。羅福莉在演講中給出了更直接的表述:AI進(jìn)化的下一個(gè)關(guān)鍵點(diǎn),一定是能夠與真實(shí)環(huán)境持續(xù)交互的物理模型。真正的智能不是從文本中“讀出來”,而是要在交互中“活出來”。
這一判斷,恰好指向小米當(dāng)前最核心的“人、車、家”生態(tài)。在這一體系中,AI不再是獨(dú)立存在的能力模塊,而必須嵌入具體業(yè)務(wù)場景,承擔(dān)感知、決策與執(zhí)行的角色。無論是智能駕駛,還是具身智能,都可能成為小米大模型從“認(rèn)知工具”走向“行動(dòng)主體”的關(guān)鍵落點(diǎn)。
值得注意的是,在12月16日晚,小米公布了MiMo-V2-Flash開源MoE模型,總參數(shù)量309B,活躍參數(shù)量15B。羅福莉表示,MiMo-V2-Flash實(shí)現(xiàn)了低成本、高速度,已初步具備模擬世界的能力。
“小米方案”打破設(shè)備局限?
按照盧偉冰披露的時(shí)間表,小米自研的MiMo系列已覆蓋推理、視覺、多模態(tài)、音頻與具身等多個(gè)層級。包括推理大模型MiMo-7B,視覺推理大模型MiMo-VL,原生端到端音頻生成模型MiMo-Audio,端側(cè)視覺語言大模型MiMo-VL-Miloco,具身大模型MiMo-Embodied。
其中,MiMo-VL-Miloco大模型顯然是為智能家居服務(wù)。11月14日,小米推出智能家居未來探索方案Xiaomi Miloco。試圖讓智能家居設(shè)備從“被動(dòng)響應(yīng)指令”,走向“主動(dòng)理解與服務(wù)”。
“AI會(huì)打破設(shè)備局限,甚至未來桌椅板凳也可以融入到智能家居系統(tǒng)”。資深互聯(lián)網(wǎng)觀察家丁道師向時(shí)代周報(bào)記者表示,“像小米Miloco這類方案,能打破設(shè)備孤島,不用你發(fā)指令,靠本地大模型就能自動(dòng)感知需求、切換場景,還能保護(hù)隱私。”丁道師指出,小米Miloco會(huì)讓智能家居從“聽指揮”變“主動(dòng)服務(wù)”。
長期以來,智能家居的核心瓶頸并不在設(shè)備數(shù)量,而在交互方式。多數(shù)系統(tǒng)依賴規(guī)則引擎,用戶需要手動(dòng)設(shè)定觸發(fā)條件與執(zhí)行邏輯:溫度多少度、時(shí)間幾點(diǎn)、哪個(gè)傳感器先觸發(fā)。這套機(jī)制在工程上穩(wěn)定,卻極度依賴用戶“提前想清楚一切”,交互體驗(yàn)因此顯得機(jī)械而碎片化。即便是熟悉智能家居體系的極客用戶,也未必愿意長期維護(hù)復(fù)雜規(guī)則。
![]()
羅福莉的首次公開亮相 時(shí)代周報(bào)記者 拍攝
國金證券研報(bào)表示,Miloco核心優(yōu)勢在于,用戶可通過口語化表達(dá)需求,由系統(tǒng)自動(dòng)調(diào)用工具創(chuàng)建智能規(guī)則,無需手動(dòng)設(shè)置復(fù)雜觸發(fā)條件;智能層面,依托自研的Xiaomi MiMo-VL-Miloco-7B 端側(cè)視覺語言大模型,結(jié)合家庭攝像頭的實(shí)時(shí)視覺數(shù)據(jù),讓智能家居從“單一條件觸發(fā)”升級到“多維度場景感知”。
事實(shí)上,有很多品牌在布局家庭智能。丁道師表示,華為、三星、美的、歐瑞博、Rokid都有Home AI概念。以后用戶使用智能家居,可能連APP都不用點(diǎn)開,回家燈自己亮、空調(diào)自己調(diào),甚至能根據(jù)用戶狀態(tài)判斷要不要放首舒緩的歌。
GKURC產(chǎn)經(jīng)智庫首席分析師丁少將則認(rèn)為,Miloco這類系統(tǒng)將改變當(dāng)前以APP為中心的碎片化操控模式,轉(zhuǎn)向以用戶意圖為核心的場景化自動(dòng)執(zhí)行。
丁少將向時(shí)代周報(bào)記者表示,智能家居領(lǐng)域會(huì)出現(xiàn)類似AI手機(jī)的集中式操作系統(tǒng)。小米的Miloco概念已展現(xiàn)出這種趨勢,通過本地化AI中樞統(tǒng)一調(diào)度跨品牌設(shè)備,實(shí)現(xiàn)主動(dòng)服務(wù)和無感交互。不過關(guān)鍵在于能否打破品牌生態(tài)壁壘,建立統(tǒng)一的協(xié)議標(biāo)準(zhǔn)。一旦實(shí)現(xiàn),智能家居將從“單點(diǎn)智能”躍升為真正自主決策的“空間智能體”,重新定義人、設(shè)備與環(huán)境的關(guān)系。





京公網(wǎng)安備 11011402013531號