2025 年 11 月 21 日,小米正式發(fā)布并開源業(yè)界首個(gè)打通自動(dòng)駕駛與具身智能的跨域基座模型MiMo-Embodied,模型與權(quán)重已同步上線Hugging Face與arXiv。
技術(shù)亮點(diǎn)
1. 跨域能力覆蓋:同一套參數(shù)同時(shí)支持具身智能三大任務(wù)(可供性推理、任務(wù)規(guī)劃、空間理解)與自動(dòng)駕駛?cè)笕蝿?wù)(環(huán)境感知、狀態(tài)預(yù)測(cè)、駕駛規(guī)劃),實(shí)現(xiàn)室內(nèi)交互與道路決策的統(tǒng)一建模。
2. 雙向協(xié)同賦能:模型驗(yàn)證了室內(nèi)交互能力與道路決策能力的知識(shí)遷移協(xié)同效應(yīng),為跨場(chǎng)景智能融合提供新思路。
3. 全鏈優(yōu)化可靠:采用“具身/自駕能力學(xué)習(xí)→CoT推理增強(qiáng)→RL精細(xì)強(qiáng)化”多階段訓(xùn)練策略,顯著提升真實(shí)環(huán)境部署可靠性。
性能表現(xiàn)
在涵蓋感知、決策與規(guī)劃的 29 項(xiàng)核心基準(zhǔn)測(cè)試中,MiMo-Embodied全面優(yōu)于現(xiàn)有開源、閉源及專用模型:具身智能領(lǐng)域 17 項(xiàng)Benchmark取得SOTA,自動(dòng)駕駛領(lǐng)域 12 項(xiàng)Benchmark刷新最佳成績,并在通用視覺語言任務(wù)上展現(xiàn)卓越泛化能力。
應(yīng)用與生態(tài)
小米計(jì)劃將MiMo-Embodied率先用于自研掃地機(jī)器人、工廠AGV及SU7 高階智駕, 2026 年Q1 起通過OTA推送;同時(shí)開放模型API,向家居、移動(dòng)出行、制造業(yè)開發(fā)者提供跨域智能底座。





京公網(wǎng)安備 11011402013531號(hào)