時隔半年,又一家只有兩三百人的中國AI創業公司給美國科技圈帶來沖擊波。他們的新模型K2讓美國科技圈意識到,中國人在計算資源限制下仍然能持續做出世界級的創新。
7月11日晚,五位清華畢業生聯合創立的中國AI公司“月之暗面”,正式發布并開源了萬億參數的Kimi K2大模型。
![]()
K2發布后因為強大的編程、智能體任務性能以及實惠的API價格在海內外科技圈逐步引發熱議,美國知名AI搜索公司Perplexity CEO稱他們會在 Kimi 新模型上繼續進行后訓練。知名編程IDE工具,開源的Cline、微軟Visual Studio Code等也紛紛宣布接入;云服務公司,金山云、硅基流動、together.ai等陸續宣布上架 Kimi K2模型。
有學者也指出K2模型引發的“Kimi 沖擊波”應該引起西方科技圈的再一次重視和覺醒。伯克利AI博士、艾倫人工智能研究所科學家內森蘭伯特7月14日撰文稱,今年年初的DeepSeek R1更像是人工智能發展軌跡中的前傳,接下來像Kimi K2?這樣的模型證明中國在資源限制下可以持續做出驚人的世界級創新,西方世界的大部分地區應該覺醒了,中國正在繼續接近或已經達到模型性能的絕對前沿,而西方在開放模型上已經落后得更遠了。
Kimi K2背后的公司月之暗面是很有代表性的一家中國AI創業公司,2024年初獲得當時國內大模型誕生的最大筆融資,被阿里、紅杉等著名資本爭投,楊植麟還和梁文峰、何凱明一同被網友稱為廣東AI三杰。但今年,春節DeepSeek橫空出世Kimi變得格外低調,在外界看來竟沒了聲音。
Kimi時刻到了?K2爆火海外
這幾天,Kimi新模型K2再一次刷屏海外技術圈。上周五晚,月之暗面正式發布K2開源大模型。作為Kimi最新MoE基礎模型,K2總參數量達到了1T,激活參數量為32B,在編程能力、工具調用能力等方面,超越其他開源模型,接近甚至部分超過了OpenAI、和谷歌的全球頂尖閉源模型。
![]()
該模型發布后,美國AI公司Perplexity CEO發帖說,Kimi模型在他們的內部評估中表現良好,將要在K2大模型上開展一些后訓練,上一次發生這種事情,還得回到今年1月DeepSeek狂卷沖擊波的時候。有意思的是,Kimi K2發布后,OpenAI CEO Sam Altman也官宣要推遲原定這周發布的開放權重模型,理由是仍需補充安全測試與高風險區域審查,且未確定延期時長。
這一次,Kimi K2大模型實行了開源策略。HuggingFace聯合創始人Thomas Wolf在 K2發布后也感嘆,K2實在令人難以置信,開源模型不斷突破極限在性能前沿對最新的閉源權重模型發起挑戰,并且價格只需要幾分之一。
AI美術工具MagicPath的CEO Pietro Schirano用完也連發好幾條博文,點贊K2在工具調用和agent方面的能力,他認為這是自Claude 3.5 Sonnet以來,自己用過的最舒服的模型。
![]()
Kimi K2為何引發海外科技圈瘋狂轉發?Hyperbolic labs的聯合創始人兼CFO Yuchen Jin發博提到,K2已經實現了訓練峰值為0,這是非常瘋狂的事情。日本AI新秀Sakana AI Labs創始人也發博提到自己被Kimi K2的損失曲線征服了,要知道,訓練峰值和損失曲線如果能達到很好的效果,就證明這個模型效能非常高,穩定性也很強。
![]()
除了在海外科技圈爆火以外,有學者也指出Kimi K2帶來的“DeepSeek 時刻”應該引起西方科技圈的再一次重視和覺醒。
伯克利AI博士、艾倫人工智能研究所科學家內森蘭伯特7月14日撰文稱,今年年初的DeepSeek R1更像是人工智能發展軌跡中的前傳,接下來像Kimi K2?這樣的模型帶來的DeepSeek 時刻將陸續有來。“如果一個‘DeepSeek 時刻’沒有讓我們醒來,我希望這一次我們能夠醒來,不要等到第三次。西方世界的大部分地區都應該覺醒了,中國正在繼續接近或已經達到模型性能的絕對前沿,而西方在開放模型上已經落后得更遠了。”
![]()
基礎模型競爭轉向Agent和編程能力
Kimi K2是一款具備更強代碼能力、更擅長通用Agent任務的MoE 架構基礎模型,代碼能力和Agent的自主工具使用能力是此次K2發布的一大重點,同時也是全球大模型廠商正在發生的轉變。
當用戶將13萬行的原始數據丟給K2,根據實測案例,它可以幫你分析遠程辦公比例對薪資的影響,還自動生成統計圖表與回歸模型解讀,并用統一色調做出相關專業圖表,整理成報告。

月之暗面方面也提到,Kimi K2目前只是做到成為構建通用Agent能力的堅實基礎,但不可否認通用Agent還需要更高級的能力,比如思考和視覺理解,未來這些能力會陸續開放。
此外,根據南都記者的實測,在最新發布的 K2大模型中,Kimi寫作和風格化能力也有所提升。
當輸入要求“面對廣東35度的大熱天,請K2幫我們寫一條吐槽的微信朋友圈,要求既通過各種環境描寫突出天氣很熱、人很難受,又要表達自己很煩、求領導不要再給自己安排工作的心情,且要小心分寸,讓領導不要一上火把自己給裁了,順帶請推薦一下朋友圈的配圖帶上什么好一些。”
![]()
Kimi K2自行開始用對比、比喻等手法發揮,并給出了配圖建議,語言基本能覆蓋給出的要求。不過,在這個案例中,K2的回答如同網友對DeepSeek的評價一樣,顯得有些用力過猛,這似乎也是所有chatbot的通病,應用時還是需要人為根據具體情境進行微調。
提高難度,要求Kimi K2給講一個簡短的“恐怖故事”,要求以工作的辦公室為地點,用簡短、三百字的形式,不要出現“鬼”的字眼又需要有文學性,達到讓人細思極恐的感覺。
![]()
在這個案例中,Kimi K2給出了一個頗具寓言色彩、警示意義的小短篇,用短短165個字節,講述了夏天加班人都懂的“恐怖”——空調壞了、加班到深夜,人類因加班最后變成了荒誕怪異的“機器人”,文字表達確實有了一定提升。
競爭之下,Kimi需要繼續證明自己
經兩年多的狂飆突進,大模型行業正在快速收攏。在海外,大模型決賽圈被收攏至OpenAI、谷歌、meta、Anthropic和xAI五家公司,各家的發布也呈現你追我趕的態勢。在國內,競爭也從未停止。
今年1月20日,DeepSeek發布R1引爆全網之時,Kimi其實也發布了其多模態推理模型K1.5.雖然和R1一起被OpenAI認證為最早破解o1技術原理的兩個模型之一,但很長一段時間,Kimi都在DeepSeek所占據C位的聚光燈外。
其后,Kimi又與DeepSeek多次在論文和模型上“撞車”。在這種頻繁的追趕和技術交鋒中,不同于DeepSeek背靠母公司幻方量化在算力和資金方面的有力支撐,Kimi除了需要堅持基礎大模型的訓練,還面臨商業化的挑戰,如何與中國的開源模型們一起打破技術壟斷,也是接下來Kimi們需要翻越的大山。
采寫:南都記者 林文琪




京公網安備 11011402013531號