美國科技圈再迎中國AI沖擊波，科學家：該醒來了

IP屬地中國·北京 編輯：顧青青南方都市報 時間：2025-07-16 10:17:27

時隔半年，又一家只有兩三百人的中國AI創業公司給美國科技圈帶來沖擊波。他們的新模型K2讓美國科技圈意識到，中國人在計算資源限制下仍然能持續做出世界級的創新。
7月11日晚，五位清華畢業生聯合創立的中國AI公司“月之暗面”，正式發布并開源了萬億參數的Kimi K2大模型。

K2發布后因為強大的編程、智能體任務性能以及實惠的API價格在海內外科技圈逐步引發熱議，美國知名AI搜索公司Perplexity CEO稱他們會在 Kimi 新模型上繼續進行后訓練。知名編程IDE工具，開源的Cline、微軟Visual Studio Code等也紛紛宣布接入；云服務公司，金山云、硅基流動、together.ai等陸續宣布上架 Kimi K2模型。
有學者也指出K2模型引發的“Kimi 沖擊波”應該引起西方科技圈的再一次重視和覺醒。伯克利AI博士、艾倫人工智能研究所科學家內森蘭伯特7月14日撰文稱，今年年初的DeepSeek R1更像是人工智能發展軌跡中的前傳，接下來像Kimi K2?這樣的模型證明中國在資源限制下可以持續做出驚人的世界級創新，西方世界的大部分地區應該覺醒了，中國正在繼續接近或已經達到模型性能的絕對前沿，而西方在開放模型上已經落后得更遠了。
Kimi K2背后的公司月之暗面是很有代表性的一家中國AI創業公司，2024年初獲得當時國內大模型誕生的最大筆融資，被阿里、紅杉等著名資本爭投，楊植麟還和梁文峰、何凱明一同被網友稱為廣東AI三杰。但今年，春節DeepSeek橫空出世Kimi變得格外低調，在外界看來竟沒了聲音。
Kimi時刻到了？K2爆火海外
這幾天，Kimi新模型K2再一次刷屏海外技術圈。上周五晚，月之暗面正式發布K2開源大模型。作為Kimi最新MoE基礎模型，K2總參數量達到了1T，激活參數量為32B，在編程能力、工具調用能力等方面，超越其他開源模型，接近甚至部分超過了OpenAI、和谷歌的全球頂尖閉源模型。

該模型發布后，美國AI公司Perplexity CEO發帖說，Kimi模型在他們的內部評估中表現良好，將要在K2大模型上開展一些后訓練，上一次發生這種事情，還得回到今年1月DeepSeek狂卷沖擊波的時候。有意思的是，Kimi K2發布后，OpenAI CEO Sam Altman也官宣要推遲原定這周發布的開放權重模型，理由是仍需補充安全測試與高風險區域審查，且未確定延期時長。
這一次，Kimi K2大模型實行了開源策略。HuggingFace聯合創始人Thomas Wolf在 K2發布后也感嘆，K2實在令人難以置信，開源模型不斷突破極限在性能前沿對最新的閉源權重模型發起挑戰，并且價格只需要幾分之一。
AI美術工具MagicPath的CEO Pietro Schirano用完也連發好幾條博文，點贊K2在工具調用和agent方面的能力，他認為這是自Claude 3.5 Sonnet以來，自己用過的最舒服的模型。

Kimi K2為何引發海外科技圈瘋狂轉發？Hyperbolic labs的聯合創始人兼CFO Yuchen Jin發博提到，K2已經實現了訓練峰值為0，這是非常瘋狂的事情。日本AI新秀Sakana AI Labs創始人也發博提到自己被Kimi K2的損失曲線征服了，要知道，訓練峰值和損失曲線如果能達到很好的效果，就證明這個模型效能非常高，穩定性也很強。

除了在海外科技圈爆火以外，有學者也指出Kimi K2帶來的“DeepSeek 時刻”應該引起西方科技圈的再一次重視和覺醒。
伯克利AI博士、艾倫人工智能研究所科學家內森蘭伯特7月14日撰文稱，今年年初的DeepSeek R1更像是人工智能發展軌跡中的前傳，接下來像Kimi K2?這樣的模型帶來的DeepSeek 時刻將陸續有來。“如果一個‘DeepSeek 時刻’沒有讓我們醒來，我希望這一次我們能夠醒來，不要等到第三次。西方世界的大部分地區都應該覺醒了，中國正在繼續接近或已經達到模型性能的絕對前沿，而西方在開放模型上已經落后得更遠了。”

基礎模型競爭轉向Agent和編程能力
Kimi K2是一款具備更強代碼能力、更擅長通用Agent任務的MoE 架構基礎模型，代碼能力和Agent的自主工具使用能力是此次K2發布的一大重點，同時也是全球大模型廠商正在發生的轉變。
當用戶將13萬行的原始數據丟給K2，根據實測案例，它可以幫你分析遠程辦公比例對薪資的影響，還自動生成統計圖表與回歸模型解讀，并用統一色調做出相關專業圖表，整理成報告。

月之暗面方面也提到，Kimi K2目前只是做到成為構建通用Agent能力的堅實基礎，但不可否認通用Agent還需要更高級的能力，比如思考和視覺理解，未來這些能力會陸續開放。
此外，根據南都記者的實測，在最新發布的 K2大模型中，Kimi寫作和風格化能力也有所提升。
當輸入要求“面對廣東35度的大熱天，請K2幫我們寫一條吐槽的微信朋友圈，要求既通過各種環境描寫突出天氣很熱、人很難受，又要表達自己很煩、求領導不要再給自己安排工作的心情，且要小心分寸，讓領導不要一上火把自己給裁了，順帶請推薦一下朋友圈的配圖帶上什么好一些。”

Kimi K2自行開始用對比、比喻等手法發揮，并給出了配圖建議，語言基本能覆蓋給出的要求。不過，在這個案例中，K2的回答如同網友對DeepSeek的評價一樣，顯得有些用力過猛，這似乎也是所有chatbot的通病，應用時還是需要人為根據具體情境進行微調。
提高難度，要求Kimi K2給講一個簡短的“恐怖故事”，要求以工作的辦公室為地點，用簡短、三百字的形式，不要出現“鬼”的字眼又需要有文學性，達到讓人細思極恐的感覺。

在這個案例中，Kimi K2給出了一個頗具寓言色彩、警示意義的小短篇，用短短165個字節，講述了夏天加班人都懂的“恐怖”——空調壞了、加班到深夜，人類因加班最后變成了荒誕怪異的“機器人”，文字表達確實有了一定提升。
競爭之下，Kimi需要繼續證明自己
經兩年多的狂飆突進，大模型行業正在快速收攏。在海外，大模型決賽圈被收攏至OpenAI、谷歌、meta、Anthropic和xAI五家公司，各家的發布也呈現你追我趕的態勢。在國內，競爭也從未停止。
今年1月20日，DeepSeek發布R1引爆全網之時，Kimi其實也發布了其多模態推理模型K1.5.雖然和R1一起被OpenAI認證為最早破解o1技術原理的兩個模型之一，但很長一段時間，Kimi都在DeepSeek所占據C位的聚光燈外。
其后，Kimi又與DeepSeek多次在論文和模型上“撞車”。在這種頻繁的追趕和技術交鋒中，不同于DeepSeek背靠母公司幻方量化在算力和資金方面的有力支撐，Kimi除了需要堅持基礎大模型的訓練，還面臨商業化的挑戰，如何與中國的開源模型們一起打破技術壟斷，也是接下來Kimi們需要翻越的大山。
采寫：南都記者林文琪

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

追覓連續六年年復合增長率超100% ，俞浩獲評「2025封面人物」

谷歌把AI大模型能力“壓縮”進手機，以后玩游戲全靠“吼”

培訓即上崗！一條閉環服務鏈，打通就業“最后一公里”

摩爾線程張建中：智算集群將做到50萬卡、100萬卡規模

科技前沿｜可控核聚變終極能源解決方案值得期待

摩爾線程，突發大消息！

全站最新

追覓連續六年年復合增長率超100% ，俞浩獲評「2025封面人物」

谷歌把AI大模型能力“壓縮”進手機，以后玩游戲全靠“吼”

培訓即上崗！一條閉環服務鏈，打通就業“最后一公里”

摩爾線程張建中：智算集群將做到50萬卡、100萬卡規模

熱門推薦

追覓連續六年年復合增長率超100% ，俞浩獲評「2025封面人物」

鞏固千元價格帶、重啟“小五糧”，五糧液系統布局三大戰略方向

央視《鴻蒙星光盛典》今晚播出

王力宏演唱會上！機器人高難度空翻獲馬斯克稱贊

摩爾線程，重大發布！

谷歌把AI大模型能力“壓縮”進手機，以后玩游戲全靠“吼”

培訓即上崗！一條閉環服務鏈，打通就業“最后一公里”

摩爾線程張建中：智算集群將做到50萬卡、100萬卡規模

科技前沿｜可控核聚變終極能源解決方案值得期待

巴西電動“飛行汽車”原型機完成首飛

摩爾線程，突發大消息！

中國社科院揭露11家冒名機構期刊，有的曾舉辦大型發布會

華為鴻蒙電腦MateBook Pro推送HarmonyOS 6.0.0.120 SP1版本

NASA毅力號火星車完成自主長距離行駛：4個多小時走了412米

上半年虧超6億，又一國產GPU獨角獸沖刺港股IPO