這兩天,月之暗面上線了名為 Kimi-Researcher 的產品,以“模型即Agent”的思路切入,標志著其在 Agent 路線上的一次明顯發力。

如果大家還記得的話,就在 Kimi 發布的前一天,MiniMax 在 MiniMax Week 的第三天也啟動了通用 Agent 的灰度測試。這兩家此前一度低調的公司幾乎在同一時段重新進入公眾視野,也讓原本趨于平靜的 AI 四小強格局再次活躍起來。

Kimi、MiniMax、智譜、階躍星辰,這幾位曾經在大模型初期階段高頻出現的名字,如今正借助 Agent 的新賽道尋找新的突破口。不管是技術報告的更新、產品形態的演進,還是實際功能的迭代,幾家廠商都在以各自的節奏向外界釋放信號。
這一輪產品集中露面的時間節點并非巧合。從時機上看,這一波集中亮相并非偶然。當前,大模型正從純粹的問答工具演進為具備自主規劃、任務執行與上下文記憶能力的智能體系統。Agent 正在從“增強生產力”轉向“替代部分人類任務角色”。對于具備模型研發和產品整合能力的廠商來說,這是一次相對公平的新起點。
報告,不只是寫完,還得像
在這樣的背景下,Kimi 推出的 Kimi-Researcher 選擇了一個很明確的切入口:深度研究。
這個定位本身就帶著濃厚的判斷意味。它不打資訊助手、也不打日常問答,而是瞄準了原本需要專業助理團隊完成的任務,例如梳理產業政策、比對跨國法規、生成調研報告等。
這類任務對模型的檢索、思考、組織、判斷能力要求極高,幾乎是對 Agent 體系的全方位考驗。
話不多說,我們直接開測。
比如說我想讓它分析下2025年上半年黃金價格波動與美聯儲政策走向的關聯性。

它沒有立刻開始寫,而是反問了我一些問題,從研究邏輯本身出發,主動確認這個任務到底該怎么做才不空轉。
這種主動澄清機制,是過去在 Deep Research(左圖展示為:ChatGPT的 research 模式)里很熟悉的,也不像 MiniMax (右圖展示為MiniMax Agent)那種一口氣跑完所有流程后才看結果的虛擬機結構,更接近一個“你提一個話題,它開始一步步推”的助研模型。


Kimi比GPT更貼心增添了“Include everything”按鈕,不是單純放開信息源,而是直接把它切換到一種更傾向生成完整結構報告的工作狀態。

經過大概十幾分鐘的等待,它一共生成了兩種版本。
一種是我們熟悉的文字版研究報告,段落結構清晰,語氣沉穩,整體邏輯偏向內容層次 + 政策推導;另一種則是自動渲染的 HTML 格式報告,已經配好封面、標題、摘要、分節說明,標注出“核心發現”“關鍵風險”“歷史規律”這些結構化小標簽。

內容還是很豐富的。
對經常要做對內材料和對外匯報的人來說,這種“寫+排+渲”一體的體驗,確實提高了交付效率。
你可以把它當成是Word+Notion+研究助理的混合體,不僅能輸出內容,還知道怎么讓內容看起來像一份真的報告。
然后我們也測了測生成PPT的能力。給它的任務是這樣的:
梳理一下 Stable Diffusion 從最初發布到最新版本的演進路線,列出各階段關鍵改進與社區貢獻節點,并作出PPT
看起來是一個非常結構化的問題,理論上應該正對 Researcher 的下懷。但實際操作過程中,我們也發現了一些限制。
1. 當前版本仍未支持多任務并行(當然,這可能只是內測階段的限制,正式版應該會放出。)

2. 并不能生成傳統PPT,只能是 HTML 格式猜測后面也會上線PPT生成能力。


作為一個學術型Agent,它在報告里自動加上了參考文獻鏈接,并用下劃線標注出處。可以完成一整套可交付內容。
而這,恰恰就是很多 AI 工具還停留在段落生成時無法做到的部分。
但當我們把這個任務交給 MiniMax Agent 時:
它不僅生成了 PPT,還一并打包了 PDF 報告、Markdown 研究文檔、圖表文件、項目任務表(todo.md)和用于可視化的 Python 腳本。
你可以下載 .pptx 源文件,二次修改內容和格式。也能查看 .md 的版本記錄、調圖的 .py 腳本,每一階段的中間產物全都可查。

從產出形式來看,它給你的是一整個PPT 制作系統,而不是一份靜態報告。
Kimi-Researcher和MiniMax Agent,哪個更適合你
從執行力上來說,兩者都已經遠超傳統意義上的聊天機器人——你不用再一句一句提示,它們可以自己補全問題、拆解任務,甚至按你沒說出口的邏輯推下去。但使用下來,兩者的Agent 感其實來自不同的方向。
Kimi-Researcher 是任務導向的,它的邏輯很清楚:你給我一個研究型問題,我就像一個訓練過的助理那樣,問你三件事、查五份資料、最后給你一份成稿。
但 MiniMax 不太一樣。
它更像一個運行在虛擬機里的多工系統——你可以把它理解成你裝了一個干活的人,但這個人是你組裝出來的。他自己并不主張“要做研究”還是“要做運營”,而是你怎么設計,他就按你的指令一步步走。有時候你會覺得,它像是個開著調試模式的智能體,你能看到它每一步調用了什么插件、在哪個頁面抓了數據、用了哪個文檔里的知識。這種透明度很高的體驗,本質上更像是你操控一個流程機器人,而不是和一個人打交道。
如果說 Kimi 是把一個智能體藏在了模型背后,讓你感受到結果;那 MiniMax 更像是把智能體攤開在你眼前,讓你參與構建過程。兩者誰更強,不一定,但它們帶來的使用心智是完全不一樣的。
還有一個重要差別,是默認角色設定。
Kimi 很明顯是自帶性格的——不夸張地說,它的Researcher標簽決定了它的行為方式,比如它更關注嚴謹表達、更傾向于做出規范排版、更容易使用資料比對視角進行總結。
而 MiniMax 給你的更多是空角色模板——你自己來寫 prompt,自己搭建鏈路,它才啟動真正的 Agent 能力。
我不是說哪個更好,我只是說它們在實現Agent這件事上,走的是完全不同的路徑。
在我們深度體驗兩者后,給出用戶一句話結論:如果你更在意“我提個需求就能直接拿到結果”,Kimi 會是更順手的選擇;但如果你希望掌控整個任務的執行流程、甚至自己定義智能體的邏輯結構,那 MiniMax 可能更適合你。
Kimi 做結果,MiniMax 做過程
說到底,Kimi 和 MiniMax 的這次同步出招,看起來像是在做 Agent,其實是在做一次底層策略切換。
Kimi 把“模型即 Agent”這件事做得非常徹底。你看不到 Agent 配置、插件安裝、工作流設計這些 Developer 套路,它不是在鼓勵你搭建 Agent,而是干脆告訴你:“Agent 本身就是模型的一部分了”。你想研究政策,它就用研究員的方式回應你。它把智能體的控制權從用戶界面撤回到了模型內部,交給了系統自動調度。
這一點是很多人沒意識到的。
過去我們理解的智能體,是我來設計、我來組合,但 Kimi 的思路是,你不需要設計,你只要告訴我你要什么結果,我來決定應該找誰干活、用什么方法、怎么安排流程。
它把整個 Agent 系統做成了一個黑箱,你丟任務進去,它自己完成任務拆解、插件調用、資料組織和內容生成。就像你發了封工作郵件,過一陣就能收到一份干凈利落的文檔回復。
很多人還在找插件入口,Kimi 已經在去插件化。
這兩種產品方向的不同,其實也能看出背后公司在策略上的側重點。Kimi 一直強調“長文本”能力和“系統性表達”,在 Researcher 這個產品上被推到極致,它更注重交付內容的完整性和邏輯性。
Kimi不是做開發者平臺,它要做的是“懂結構、能調度”的模型本體。這也解釋了為什么它一上來就定位在最復雜的研究類任務,因為這種任務能最大程度激活它預設的 Agent 內部機制:澄清問題、檢索并行、結構統籌、表達生成。這不是讓你看到它能干什么,而是逼你意識到,你其實可以不再親自干。
這點對用戶心智的沖擊,其實比 MiniMax 更強。并且,Kimi這次是完全基于自研模型,沒有像其他Agent一樣調用Claude、Gemini的能力。
MiniMax 反而是最像 Agent的那一個。你真的可以看到它調用了哪些函數,爬了哪些網頁,引用了哪段語料,它給你一個完整的操作軌道,你像是在 Debug 一個機器人的思路流程。這讓它特別適合那些自己有一套流程、知道怎么干活的人。你可以把它當成 Agent 的 IDE ——你是工程師,它是執行層。
但這個過程中,大多數用戶其實是有門檻的。
你需要理解:插件怎么綁定、變量怎么配置、路徑怎么切換、長文本怎么緩存……你得像在搭一個流程工廠。而 Kimi 則直接告訴你:“你什么都不用管,只要告訴我要結果。”
這個差別說到底,是兩家公司對智能體未來形態的不同下注。
MiniMax 賭的是:AI 應該成為一個流程平臺,你來決定它長成什么樣。
Kimi 賭的是:AI 應該直接成為一個能干事的角色,讓你不再需要流程本身。
這兩條路背后的預設完全不同。一個相信每個用戶都該擁有自己的Agent,一個相信模型應該成為能自動執行復雜任務的交付體。
Kimi 是在重新定義什么是工具,MiniMax 是在放大工具能到多深。
這場Agent戰役其實不是從用戶開始的,而是從怎么分配任務這件事開始的。而這,恰恰是大模型能力真正能走入現實的起點。
你以為你在選一個Agent工具,其實你在決定的是:你愿不愿意把解決問題的方式,也一并交給它。





京公網安備 11011402013531號