實測Kimi首個Agent：智能體與模型之間的區隔消失了？

IP屬地中國·北京 編輯：鐘景軒華爾街見聞 時間：2025-06-24 22:02:20

這兩天，月之暗面上線了名為 Kimi-Researcher 的產品，以“模型即Agent”的思路切入，標志著其在 Agent 路線上的一次明顯發力。
如果大家還記得的話，就在 Kimi 發布的前一天，MiniMax 在 MiniMax Week 的第三天也啟動了通用 Agent 的灰度測試。這兩家此前一度低調的公司幾乎在同一時段重新進入公眾視野，也讓原本趨于平靜的 AI 四小強格局再次活躍起來。
Kimi、MiniMax、智譜、階躍星辰，這幾位曾經在大模型初期階段高頻出現的名字，如今正借助 Agent 的新賽道尋找新的突破口。不管是技術報告的更新、產品形態的演進，還是實際功能的迭代，幾家廠商都在以各自的節奏向外界釋放信號。
這一輪產品集中露面的時間節點并非巧合。從時機上看，這一波集中亮相并非偶然。當前，大模型正從純粹的問答工具演進為具備自主規劃、任務執行與上下文記憶能力的智能體系統。Agent 正在從“增強生產力”轉向“替代部分人類任務角色”。對于具備模型研發和產品整合能力的廠商來說，這是一次相對公平的新起點。
報告，不只是寫完，還得像
在這樣的背景下，Kimi 推出的 Kimi-Researcher 選擇了一個很明確的切入口：深度研究。
這個定位本身就帶著濃厚的判斷意味。它不打資訊助手、也不打日常問答，而是瞄準了原本需要專業助理團隊完成的任務，例如梳理產業政策、比對跨國法規、生成調研報告等。
這類任務對模型的檢索、思考、組織、判斷能力要求極高，幾乎是對 Agent 體系的全方位考驗。
話不多說，我們直接開測。
比如說我想讓它分析下2025年上半年黃金價格波動與美聯儲政策走向的關聯性。
它沒有立刻開始寫，而是反問了我一些問題，從研究邏輯本身出發，主動確認這個任務到底該怎么做才不空轉。
這種主動澄清機制，是過去在 Deep Research（左圖展示為：ChatGPT的 research 模式）里很熟悉的，也不像 MiniMax （右圖展示為MiniMax Agent）那種一口氣跑完所有流程后才看結果的虛擬機結構，更接近一個“你提一個話題，它開始一步步推”的助研模型。
Kimi比GPT更貼心增添了“Include everything”按鈕，不是單純放開信息源，而是直接把它切換到一種更傾向生成完整結構報告的工作狀態。
經過大概十幾分鐘的等待，它一共生成了兩種版本。
一種是我們熟悉的文字版研究報告，段落結構清晰，語氣沉穩，整體邏輯偏向內容層次 + 政策推導；另一種則是自動渲染的 HTML 格式報告，已經配好封面、標題、摘要、分節說明，標注出“核心發現”“關鍵風險”“歷史規律”這些結構化小標簽。
內容還是很豐富的。
對經常要做對內材料和對外匯報的人來說，這種“寫+排+渲”一體的體驗，確實提高了交付效率。
你可以把它當成是Word+Notion+研究助理的混合體，不僅能輸出內容，還知道怎么讓內容看起來像一份真的報告。
然后我們也測了測生成PPT的能力。給它的任務是這樣的：
梳理一下 Stable Diffusion 從最初發布到最新版本的演進路線，列出各階段關鍵改進與社區貢獻節點，并作出PPT
看起來是一個非常結構化的問題，理論上應該正對 Researcher 的下懷。但實際操作過程中，我們也發現了一些限制。
1. 當前版本仍未支持多任務并行（當然，這可能只是內測階段的限制，正式版應該會放出。）
2. 并不能生成傳統PPT，只能是 HTML 格式猜測后面也會上線PPT生成能力。
作為一個學術型Agent，它在報告里自動加上了參考文獻鏈接，并用下劃線標注出處。可以完成一整套可交付內容。
而這，恰恰就是很多 AI 工具還停留在段落生成時無法做到的部分。
但當我們把這個任務交給 MiniMax Agent 時：
它不僅生成了 PPT，還一并打包了 PDF 報告、Markdown 研究文檔、圖表文件、項目任務表（todo.md）和用于可視化的 Python 腳本。
你可以下載 .pptx 源文件，二次修改內容和格式。也能查看 .md 的版本記錄、調圖的 .py 腳本，每一階段的中間產物全都可查。
從產出形式來看，它給你的是一整個PPT 制作系統，而不是一份靜態報告。
Kimi-Researcher和MiniMax Agent，哪個更適合你
從執行力上來說，兩者都已經遠超傳統意義上的聊天機器人——你不用再一句一句提示，它們可以自己補全問題、拆解任務，甚至按你沒說出口的邏輯推下去。但使用下來，兩者的Agent 感其實來自不同的方向。
Kimi-Researcher 是任務導向的，它的邏輯很清楚：你給我一個研究型問題，我就像一個訓練過的助理那樣，問你三件事、查五份資料、最后給你一份成稿。
但 MiniMax 不太一樣。
它更像一個運行在虛擬機里的多工系統——你可以把它理解成你裝了一個干活的人，但這個人是你組裝出來的。他自己并不主張“要做研究”還是“要做運營”，而是你怎么設計，他就按你的指令一步步走。有時候你會覺得，它像是個開著調試模式的智能體，你能看到它每一步調用了什么插件、在哪個頁面抓了數據、用了哪個文檔里的知識。這種透明度很高的體驗，本質上更像是你操控一個流程機器人，而不是和一個人打交道。
如果說 Kimi 是把一個智能體藏在了模型背后，讓你感受到結果；那 MiniMax 更像是把智能體攤開在你眼前，讓你參與構建過程。兩者誰更強，不一定，但它們帶來的使用心智是完全不一樣的。
還有一個重要差別，是默認角色設定。
Kimi 很明顯是自帶性格的——不夸張地說，它的Researcher標簽決定了它的行為方式，比如它更關注嚴謹表達、更傾向于做出規范排版、更容易使用資料比對視角進行總結。
而 MiniMax 給你的更多是空角色模板——你自己來寫 prompt，自己搭建鏈路，它才啟動真正的 Agent 能力。
我不是說哪個更好，我只是說它們在實現Agent這件事上，走的是完全不同的路徑。
在我們深度體驗兩者后，給出用戶一句話結論：如果你更在意“我提個需求就能直接拿到結果”，Kimi 會是更順手的選擇；但如果你希望掌控整個任務的執行流程、甚至自己定義智能體的邏輯結構，那 MiniMax 可能更適合你。
Kimi 做結果，MiniMax 做過程
說到底，Kimi 和 MiniMax 的這次同步出招，看起來像是在做 Agent，其實是在做一次底層策略切換。
Kimi 把“模型即 Agent”這件事做得非常徹底。你看不到 Agent 配置、插件安裝、工作流設計這些 Developer 套路，它不是在鼓勵你搭建 Agent，而是干脆告訴你：“Agent 本身就是模型的一部分了”。你想研究政策，它就用研究員的方式回應你。它把智能體的控制權從用戶界面撤回到了模型內部，交給了系統自動調度。
這一點是很多人沒意識到的。
過去我們理解的智能體，是我來設計、我來組合，但 Kimi 的思路是，你不需要設計，你只要告訴我你要什么結果，我來決定應該找誰干活、用什么方法、怎么安排流程。
它把整個 Agent 系統做成了一個黑箱，你丟任務進去，它自己完成任務拆解、插件調用、資料組織和內容生成。就像你發了封工作郵件，過一陣就能收到一份干凈利落的文檔回復。
很多人還在找插件入口，Kimi 已經在去插件化。
這兩種產品方向的不同，其實也能看出背后公司在策略上的側重點。Kimi 一直強調“長文本”能力和“系統性表達”，在 Researcher 這個產品上被推到極致，它更注重交付內容的完整性和邏輯性。
Kimi不是做開發者平臺，它要做的是“懂結構、能調度”的模型本體。這也解釋了為什么它一上來就定位在最復雜的研究類任務，因為這種任務能最大程度激活它預設的 Agent 內部機制：澄清問題、檢索并行、結構統籌、表達生成。這不是讓你看到它能干什么，而是逼你意識到，你其實可以不再親自干。
這點對用戶心智的沖擊，其實比 MiniMax 更強。并且，Kimi這次是完全基于自研模型，沒有像其他Agent一樣調用Claude、Gemini的能力。
MiniMax 反而是最像 Agent的那一個。你真的可以看到它調用了哪些函數，爬了哪些網頁，引用了哪段語料，它給你一個完整的操作軌道，你像是在 Debug 一個機器人的思路流程。這讓它特別適合那些自己有一套流程、知道怎么干活的人。你可以把它當成 Agent 的 IDE ——你是工程師，它是執行層。
但這個過程中，大多數用戶其實是有門檻的。
你需要理解：插件怎么綁定、變量怎么配置、路徑怎么切換、長文本怎么緩存……你得像在搭一個流程工廠。而 Kimi 則直接告訴你：“你什么都不用管，只要告訴我要結果。”
這個差別說到底，是兩家公司對智能體未來形態的不同下注。
MiniMax 賭的是：AI 應該成為一個流程平臺，你來決定它長成什么樣。
Kimi 賭的是：AI 應該直接成為一個能干事的角色，讓你不再需要流程本身。
這兩條路背后的預設完全不同。一個相信每個用戶都該擁有自己的Agent，一個相信模型應該成為能自動執行復雜任務的交付體。
Kimi 是在重新定義什么是工具，MiniMax 是在放大工具能到多深。
這場Agent戰役其實不是從用戶開始的，而是從怎么分配任務這件事開始的。而這，恰恰是大模型能力真正能走入現實的起點。
你以為你在選一個Agent工具，其實你在決定的是：你愿不愿意把解決問題的方式，也一并交給它。

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

【新書】《生命傳》：基因不是答案，而是問題的開始

“飛天”健身器上天！青島英派斯為航天員健康護航

空客最暢銷窄體客機首次在中國進行高難度機身系統裝配

向新而行·育見未來丨武漢：打造人形機器人完整生態體系為全球具身智能發展提供 “武漢方案”

宇樹科技王興興亮相國新辦：未來3至5年，人形機器人應用將加速

機器人共舞“智”造“新”時刻

全站最新

一屏多用：華為Mate X7 / XTs折疊屏手機“變身”智能手卡

美國一法院放行馬斯克原560億美元薪酬方案

京東七鮮石家莊首店開業爆火，現烤花邊蛋撻單日售出超1萬只！

「AI新世代」沖刺“全球大模型第一股”！智譜叩開港股大門，大模型“淘金熱”進入資本成色檢驗時刻

熱門推薦

【新書】《生命傳》：基因不是答案，而是問題的開始

“飛天”健身器上天！青島英派斯為航天員健康護航

空客最暢銷窄體客機首次在中國進行高難度機身系統裝配

向新而行·育見未來丨武漢：打造人形機器人完整生態體系為全球具身智能發展提供 “武漢方案”

宇樹科技王興興亮相國新辦：未來3至5年，人形機器人應用將加速

機器人共舞“智”造“新”時刻

黃仁勛：中國有非常獨特的優勢發展人形機器人

迎接下一個AI浪潮，近千只機器人概念股集體“躁動”

武漢市力爭2027年人形機器人產業規模超100億元

對話 | 做“金字塔尖”的手術機器人

“傳遞能量方塊”開啟！未來一個月機器人將在北京街頭“快閃”

聚焦人形機器人關鍵領域開展技術創新，多位湖北省政協委員建言科技創新和產業創新融合發展

古人發明的3大“奇技淫巧”，有的物件，放到現在仍算是高科技

《疫苗冷鏈上鏈：99.6%合規率背后的物聯網+區塊鏈融合》

折疊屏手機選購指南：這三款旗艦讓你一手掌握未來科技