Fast Reading
■ 月之暗面發布了新一代模型Kimi K2 Thinking。與之同時引發熱議的,不僅是它在數學推理、代碼理解上的進步,還有它背后的一個數字——460萬美元的訓練成本。
■ 在估值5000億美元的“AI獨角獸之王”OpenAI面前,糧草彈藥薄弱的中國初創公司要想突圍,“硬剛”顯然不現實,只能另辟蹊徑、彎道超車。
■ 月之暗面正代表一種新型的AI力量——它不一定最豪華,卻可能最高效;不一定擁有最多資源,卻更懂得如何讓資源發揮最大價值。
![]()
10月的最后一個工作日,雪豹財經社拜訪了月之暗面的北京辦公室。我們注意到,月之暗面的會議室都以樂隊命名:Pink Floyd、The Rolling Stone、Queen、The Beatles、Radiohead......
阿里有“光明頂”,百度有“昆侖”,它們講秩序與修煉;月之暗面卻更像一支正在排練的樂隊,崇尚自由、創新和反叛。搖滾樂在誕生之初,就是一種“低投入門檻”的音樂:它不需要復雜的錄音室或昂貴的樂器,一把破吉他、一套架子鼓就能表達強大的力量。
就在那次拜訪后一周,11月6日,月之暗面發布了新一代模型“Kimi K2 Thinking”。與之同時引發熱議的,不僅是它在數學推理、代碼理解上的進步,還有它背后的一個數字——460萬美元的訓練成本。
在一個大型AI模型動輒要花幾千萬美元、幾億算力小時的時代,這個數字顯得幾乎不真實。但它確實發生了——而且,類似的故事正在中國反復上演,它們共同指向一個事實:中國的AI產業正在進入一個高效期:模型越來越強,但花的錢越來越少。
問題是,這意味著什么?
“中國效率”再次震撼硅谷
CNBC一則有關KimiK2 Thinking訓練成本的報道,猶如巨石投入水面,業界一片嘩然。
460萬美元,還不到GPT-4訓練成本的8%,甚至比DeepSeek披露的V3訓練成本(租賃價,正式訓練階段)560萬美元還要低。
而在性能上,Kimi K2 Thinking在Humanity‘s Last Exam、BrowseComp等部分權威基準測試中,取得了媲美甚至超越GPT-5和Claude 4.5等頂級模型的表現。
長期以來,在人們的印象中,AI能力與天價資本支出之間似乎已形成了線性關系:更強大的模型,理應對應著更龐大的投入。
但Kimi K2和DeepSeek的出現都打破了這個邏輯,重建了一套新的敘事,徹底顛覆了傳統認知。
雖然此后月之暗面創始團隊出面回應:“這不是官方數據。訓練成本很難計算,因為其中很大一部分用于研究和實驗。”但在巨大的成本差異面前,這個解釋并沒有稀釋業界的驚嘆。
Hugging Face聯合創始人Thomas Wolf 甚至發出靈魂拷問:“我們是否每隔幾個月就要經歷一次‘DeepSeek 時刻’?”
與之形成鮮明對比的是,今年8月,OpenAI首席執行官山姆?奧爾特曼(SamAltman)表示,未來公司將投入數萬億美元夯實AI基建,用于支持各項人工智能服務。而就在Kimi K2發布后兩天,甲骨文一筆高達180億美元的數據中心融資交易的消息公布。
兩相對比,海外媒體開始反思中美兩國在AI基礎設施投入和發展模式的差異。
CNBC預計,到2027年,美國將在數據中心上投入近7000億美元,而相比之下,中國的主要玩家,包括阿里巴巴、騰訊、字節跳動和百度,合計預期投入不到800億美元。也就是說,資本支出差距高達10:1,但系統性能卻基本相當。
當美國玩家在通過私人信貸和債券市場為龐大的數據中心融資時,中國同行正在靠效率取勝——使用更便宜的芯片、開源模型,以及需要更少資本投入的精簡基礎設施。
據一家國際媒體估算,Kimi K2 Thinking的API價格比OpenAI和Anthropic的同類模型便宜6到10倍,可能對企業的采用模式造成沖擊。
Thomas Wolf表示,Kimi K2 Thinking發布后,已成為該平臺上最受開發者歡迎的模型。
進一步的質疑在于,AI領域的游戲規則是否正在被改寫?
Interconnected Capital 創始人兼首席投資官Kevin Xu在接受CNBC采訪時表示,此前,人工智能領域幾乎所有的事情都是由硬件主導的,這就是為什么OpenAI、Anthropic能夠做它們所做的事情。但DeepSeek的進化提供了在中國發展人工智能的另一種方式,即軟件主導。
如今,從DeepSeek、阿里巴巴的通義大模型,再到Kimi K2 Thinking,中國的大模型,正在通過開源策略和極致的成本效率,改變人工智能領域的競爭態勢和格局。
Kimi K2 Thinking 為何“炸場”?
Kimi K2 Thinking之所以大受歡迎,原因很簡單:更聰明,但價格更低。
以每百萬Token的API調用成本來對比,K2 Thinking的輸入和輸出成本分別為0.15和2.5美元 ,GPT-5分別為1.25和10美元。
市場的認知已經被重塑:最實用的模型≠最貴的模型。
在過去很長一段時間,資金算力決定論是美國模式主導下的敘事邏輯。OpenAI、Anthropic、Google DeepMind們爭相掀起大模型“軍備競賽”,但錢燒得越來越快,模型進步卻越來越慢。據美國投行摩根士丹利的估算,訓練GPT-4的成本超過6000萬美元。
而在中國,我們看到的恰好相反:Kimi用幾十分之一的成本,達到了接近GPT的能力。
估值5000億美元的“AI獨角獸之王”OpenA,技術團隊規模幾千人,其中大部分是高薪挖來的專家,已部署超過10 萬塊NVIDIA H100 GPU,接下來還有1萬億美元的算力擴張計劃。而月之暗面估值33億美元,不及前者的1%,技術團隊只有200余人。
在這場完全不對等的對決面前,糧草彈藥薄弱的中國初創公司要想突破OpenAI們的銅墻鐵壁,“硬剛”顯然不現實,只能另辟蹊徑、彎道超車。
Kimi現階段的重點是:“充分壓榨每一張卡”,通過架構優化和成本控制換取最佳性能。
從燒錢競賽轉向效率競賽,這并非“中國效率”第一次給硅谷帶來“億點點”小小的震撼。
自去年年底DeepSeek R1橫空出世,在大幅降低推理成本的達到了與o1并肩的表現,國產大模型多次貢獻令人驚喜的表現。Qwen躋身Hugging Face模型下載榜單的Top 10,智譜(Z.ai)的GLM系列模型、MiniMax等也頗受海外用戶關注。
換句話說,中國AI創新在資源限制中不斷涌現。
“小米加步槍”的突圍邏輯
如果說 2022 年 ChatGPT 的發布標志著“AI 啟蒙”,那么進入2025年,中國AI在有限資源下涌現出的創新,用有限的算力榨出的極限性能,一次次向世界展示了中國團隊的技術實力。
AI創新不僅是算力競賽,也是效率競爭;AI的競爭不僅是“有多少錢”,也是“怎么用好每一分錢”。
Kimi和DeepSeek的崛起,讓全球觀察者重新審視一個老問題:為什么那些沒有寵大資金支撐的中國團隊,能在AI領域接連跑出黑馬?
答案或許可以概括為三點:技術哲學、資源稟賦、算法策略。
美國的大模型往往帶著“科研理想主義”的浪漫色彩——先設想一個理想系統,再投入海量資源去逼近。而中國的團隊更像是“工程現實主義者”——現有資源下的最優解是什么。
DeepSeek 在去年引入了被稱為“稀疏激活”的技術,即模型在推理時并非激活所有神經元,而是根據任務動態選擇部分網絡參與,從而將推理成本壓縮至原來的幾分之一。
Kimi K2模型第一次在超大規模的模型上采用了全新一代的優化器,實現了2倍左右的效率提升。
11月5日,就在Kimi K2 Thinking發布的前一天,英偉達CEO黃仁勛在一場閉門會中斷言:“中國將贏下這場人工智能的全球競賽”。
重估中國AI基模的三重邏輯
是時候給月之暗面們重新估值了。因為,資本市場正在慢慢意識到:AI公司的真正壁壘,或許不再是參數規模,而是單位算力產出價值(Compute Efficiency)。
對月之暗面們的價值重估至少有三重邏輯:
第一重,從“資本密集型”轉向“智力密集型”。不到500萬美元訓練出能與GPT-4相抗的模型,意味著這家公司擁有一種新型技術杠桿,能在低成本條件下保持高速創新。這種能力本身就是資本市場最稀缺的資產——即高ROI的研發能力。
第二重,成本結構可復制,商業化可預期。與那些動輒上億美元的模型不同,Kimi的成本意味著它的更新頻率更高、風險更可控。這讓月之暗面具備了可持續迭代的模型。有點類似于服裝行業為應對快速變化的市場需求而建立的柔性生產體系。
第三重,戰略位置:處于中國AI生態的關鍵節點。中國的AI產業正處在“算力去中心化”的關鍵階段。以阿里、字節為代表的巨頭,以Deepseek、月之暗面為代表的模型公司,正在形成一條從底層框架到應用的“內生循環”。DeepSeek和Kimi的出現,不僅補全了“高性價比模型”這一生態空白,也成為中國AI產業全球化的新樣板。它證明了,不依賴巨額算力投入,也能在技術上正面對標國際頂級模型。
過去三年,AI 競爭的關鍵詞是“大”:參數更大、語料更大、訓練集群更大。
但接下來,它會變成另一種邏輯:誰能以最少的資源,創造出最強的智能。
未來的AI競爭將不再是“硬件戰爭”,而是四個維度的綜合較量:數據效率——誰能用更少的數據訓練出更通用的模型;算法創新——誰能讓模型學得更快、想得更深;推理成本——誰能讓AI的使用成本降到人人可負擔;場景融合——誰能最快把AI變成真實生產力。
中國的機會正在于此:在硬件上雖有短板,但在成本結構、產業整合、場景落地上具備極強的實踐能力。
而像月之暗面這樣的公司,正代表著這種新型AI力量——它不一定最豪華,卻可能最高效;不一定擁有最多資源,卻更懂得如何讓資源發揮最大價值。
在這一新的周期里,決定勝負的不只是誰擁有更多芯片,還有誰能用有限的芯片做出最聰明的模型和應用。
DeepSeek和 Kimi的幾百萬美元,也許不僅是一筆訓練預算的數字,更是中國人在限制中也能持續創新的生動注腳。
作者 | 陳序寧
編輯 | 黃運濤
封面kimi官網
End





京公網安備 11011402013531號