光錐智能 魏琳華
從年初曝出與雷軍接觸、離職,到上個月官宣加入小米,再到本月出席小米人車家全生態大會,被冠以天才少女名號的羅福莉,站在臺前拿出了新模型MiMo-V2-Flash。
剛剛在這個領域開始起跑的小米,交出了一份看起來不錯的成績單。
作為一個參數309B、激活參數15B的大模型(羅福莉本人也提到,這個尺寸小到不愿意稱之為大模型),在小米團隊的構想中,這個模型是為了給Agent當基座來訓練的。
為此,這個模型的優化更加側重一些特定的方向,核心是高性價比、快速:
比如能夠達到每秒150 tokens的生成速度、極低的成本,在保持高性價比的同時,它還保證了模型的性能。
它的代碼能力和 Agent 能力在世界級公開公正的評估榜單上,已經進入了全球開源模型 Top 1-2 的行列。羅福莉說,大部分評估基準已經超過或者和DeepSeek-V3、Kimi K2- Thinking、Qwen等模型相當,但它的參數是后者們的1/2-1/3。
發布的小米模型,也面臨了兩極分化的口碑,有人盛贊模型代碼能力領先,有人則認為這是一個刷分之作。
無論如何,小米需要AI。
選在12月18日的人車家全生態大會,更說明了AI之于小米的重要性。
放到智能終端,擺在小米眼前的兩個任務是:第一,做輕量化模型,靠端側部署,升級超級小愛和澎湃OS,把AI接入智能終端;第二,智駕方面,小米則更需要大模型做基座,靠模型給智駕能力提升空間。
做AI上,小米用行動表示,自己動真格了。
01 壓成本、提速,小米押注Agent
從一開始,小米做AI的目標,或許早在2023年雷軍的年度演講上就提到了輕量化+端側部署。
羅福莉在演講中直言,當下模型學習的方向與生物智能的進化方向存在背離,單純的大力出奇跡已難以涌現更高階的智能。
當Scaling Law能夠帶來的提升越來越少,小米選擇了一條更契合自身的路:做一個參數小、性能好且夠便宜的模型。
Scaling的范式已經逐步從預訓練(Pre-train)轉向后訓練(Post-train),羅福莉解釋道,我們如何激發后訓練的潛能?這就需要一個穩定的范式,以便在強化學習(RL)上投入更多的算力。
為此,作為一個給Agent打底的模型,MiMo-V2-Flash的優化邏輯指向了三個關鍵問題:
高效溝通:強化代碼能力和工具調用,這是智能體交互的基礎。
加速帶寬:通過極高的推理效率,解決智能體之間信息傳遞的瓶頸。
發力后訓練:通過穩定范式,激發強化學習的潛能。
由此,小米做了個309B的大模型MiMo-V2-Flash,從指標上來看,它最突出的地方在于代碼能力。
在官方給出的數據中,可以看到,在SWE-Bench Multilingual(軟件工程基準測試中的多語言版本)中,該模型甚至超過了包括GPT-5在內的一眾閉源大模型。
雖然在其他指標上,該模型和DeepSeek V3.2、kimi k2 Thinging等開源模型還有些許差距,但作為一個尺寸較小的模型,表現已經很亮眼。
更核心的其實是這個模型在推理速度和價格上的優化:
用Claude Sonnet 4.5作為對比指標,小米新模型的推理價格僅為其2.5%,生成速度卻是其2倍。
MiMo-V2-Flash的API定價為,輸入0.7元/百萬tokens,輸出2.1元/百萬tokens。和國內模型相比,這也是一個非常具備競爭力的價格。
為了優化成本,提升推理速度,小米披露了其背后的技術架構選擇混合注意力機制。
從混合注意力機制上下手,月之暗面、MiniMax等獨角獸也曾在類似方向上探索。
小米的選擇是,采用了5:1的滑動窗口注意力(Sliding Window Attention, SWA)與全局注意力(Global Attention, GA)的混合結構。
官方實驗表明,SWA在長文和推理能力上優于主流的線性注意力機制,且固定大小的KV Cache極易適配現有的基礎設施(Infra)。
不過,對于小米來說,如果要達到在會上宣講的效果,把模型接入到車、手機等設備中,300B還是一個不小的規模,距離端側落地仍有距離。
最耐人尋味的,或許是羅福莉在演講時的結語:
AI進化的下一個起點,一定要有一個可以跟真實環境交互的物理模型,羅福莉說道,我們要打造的本質上不是一個程序,而是一個具備物理一致性、時空連貫性的虛擬宇宙。
從今年小米的模型發布動態上,我們猜測,小米未來的優化將被拆解為兩條線:一是死磕端側,為智能終端加碼;二是攻克物理模型,補足在智駕方面的模型能力。
02 做端側、做智駕AI給小米全家桶打底
無論外界對參數和架構的討論如何熱烈,對小米而言,AI的價值最終必須回歸到業務。
選在12月18日的人車家全生態大會發布模型,本身就說明了AI之于小米的戰略意義:
在智能終端側,通過升級超級小愛和澎湃OS,讓它們從指令執行者變為真正的助理;在智能駕駛側,則急需大模型作為基座,拓展智駕的上限。
回顧2025年,小米在MiMo系列上的發力呈現出一種急行軍的態勢,不同于兩年前模型發布后的安靜,今年的小米高調了起來。
4月:開源MiMo-7B系列,覆蓋基礎、指令微調及強化學習版。
5月:發布MiMo-VL-7B,突破多模態視覺理解。
11月:推出MiMo-Embodied具身智能大模型,整合自動駕駛與機器人技術。
12月:MiMo-V2-Flash壓軸登場,主打極致效率與Agent能力。
這一連串動作的背后,是巨額的真金白銀。小米集團總裁盧偉冰在財報電話會上明確表示,AI是核心研發方向。2025年,小米研發投入預計超過300億元,其中四分之一(約75億元)將直接砸向AI領域,并計劃在未來五年投入超過2000億元。
在端側,我們要追求輕量算力、低功耗和周期成本,這樣才能普及端側AI,盧偉冰說道,這一定是小米未來的大方向,也是小米的優勢所在。
組織層面的動作,同樣印證了小米的決心:從2024年開始,小米搭建了自己的AI Infra平臺,去年年底,界面新聞爆出,小米正在著手搭建自己的GPU萬卡集群,將對AI大模型大力投入。據悉,其團隊在成立時已有6500張GPU資源。
為了支撐這一戰略,小米的人才拼圖也在2025年逐步完整。
除了負責基礎大模型的羅福莉,小米還挖來了陳龍服務于智駕團隊。這種雙核配置在技術路線上已經初見成效陳龍團隊提出并開源了全球首個打通自駕與具身操作的跨具身(X-Embodied)基座模型MiMo-Embodied。
這一模型試圖解決自動駕駛與機器人之間的知識遷移難題,意味著小米正在嘗試用一套通用的AI邏輯,去驅動其龐大的硬件生態從手中的手機,到智能家居,再到智駕。
雷軍曾提到,小米的AI戰略是輕量化+本地部署。可以看到,小米是一定會利用在全球連接超過10億臺設備的巨大存量優勢,靠AI做業務。
對于小米來說,MiMo-V2-Flash的發布不僅僅是為了在排行榜上占據一席之地。它是小米試圖向資本市場和用戶講述的一個新故事:
一家硬件公司,正在通過掌握最高效的大腦(AI模型)和最廣泛的身體(人車家生態),試圖在智能時代完成一次徹底的進化。
至于這個故事能否講通,不僅取決于模型做得好不好,更取決于這些技術能否真正跑通每一臺小米設備,轉化為用戶感知得到的體驗。





京公網安備 11011402013531號