12月17日,小米官方宣布Xiaomi MiMo-V2-Flash開源。據(jù)悉,該模型是小米專為極致推理效率自研的總參數(shù)309B(激活15B)的MoE模型,通過引入Hybrid 注意力架構(gòu)創(chuàng)新及多層MTP推理加速,在多個(gè)Agent測評(píng)基準(zhǔn)上進(jìn)入全球開源模型Top2。代碼能力比肩標(biāo)桿閉源模型Claude 4.5 Sonnet,但推理價(jià)格僅為其2.5%且生成速度提升至2倍。

今日上午的2025小米“人車家全生態(tài)”合作伙伴大會(huì)上,Xiaomi MiMo大模型負(fù)責(zé)人羅福莉也介紹了該模型構(gòu)建的細(xì)節(jié)。她稱,Xiaomi MiMo-V2-Flash在大部分評(píng)測基準(zhǔn)上超過了DeepSeek V3.2和K2-Thinking,同時(shí)對(duì)比參數(shù)量減少了二分之一至三分之二,在全球大致處于相同水位的頂尖模型速度和成本象限里,MiMo-V2-Flash實(shí)現(xiàn)了低成本、高速度,已初步具備模擬世界的能力。

羅福莉稱,在她看來,下一代智能體系統(tǒng)不是一個(gè)“語言模擬器”,而是一個(gè)真正理解人類世界,并與之共存的“智能體”。Agent執(zhí)行能力方面,應(yīng)實(shí)現(xiàn)從“回答問題”到“完成任務(wù)”的轉(zhuǎn)變,具備記憶、推理、自主規(guī)劃、決策、執(zhí)行等能力。從Omni感知角度看,應(yīng)實(shí)現(xiàn)統(tǒng)一多模態(tài)感知,為理解物理世界打基礎(chǔ),從而更好地嵌入眼鏡等智能終端。





京公網(wǎng)安備 11011402013531號(hào)