![]()
當(dāng)整個 AI 圈都在為 DAU(日活躍用戶數(shù))和融資額焦慮時,MiniMax 創(chuàng)始人閆俊杰卻表現(xiàn)出一種近乎冷酷的淡漠。
坐在羅永浩對面的閆俊杰,并不像一位掌管著 AI 獨角獸企業(yè)的技術(shù)新貴。
![]()
他拒絕談?wù)摳淖兪澜纾炊钩锌謶帧D欠N恐懼不是來自商業(yè)競爭,而是來自技術(shù)本身——當(dāng)模型的能力開始超越人類時,創(chuàng)造者反而成了最先感到不安的人。
只要是一個東西能被量化,模型就一定會強于人,或者一定是能到最好的人類的那一檔水平。所有做得比較成功的模型,在做出來之前都會有點害怕。
據(jù)晚點采訪,在 MiniMax 內(nèi)部,互聯(lián)網(wǎng)行業(yè)奉為圭臬的 DAU ,被閆俊杰直接定義為「虛榮指標(biāo)」。
在巨頭環(huán)伺、算力短缺、熱錢褪去的 2025 年,MiniMax 正在進行一場關(guān)于認(rèn)知的修正:不再沿用移動互聯(lián)網(wǎng)的邏輯,即通過大規(guī)模投放換取增長、通過堆砌功能留住用戶,而是回歸本質(zhì):把模型當(dāng)作最重要的產(chǎn)品。
在大模型時代,真正的產(chǎn)品其實是模型本身,傳統(tǒng)意義上的產(chǎn)品更像是一個渠道。如果模型不夠聰明,產(chǎn)品做得再好也沒有用。
在羅永浩和閆俊杰這期對談里,我發(fā)現(xiàn) MiniMax 這家 AI 公司從創(chuàng)業(yè)第一天就選擇了注定與主流背道而馳的技術(shù)路徑。
當(dāng)所有人都試圖尋找中國的 OpenAI 和 Sam Altman 時,閆俊杰卻在試圖證明「非天才」的價值。MiniMax 的故事不是關(guān)于天才的靈光乍現(xiàn),而是一場關(guān)于如何在資源受限的縫隙中,通過極度理性地計算與修正,撕開一道通往 AGI 窄門的精密實驗。
用 1/50 的籌碼通往 AGI
MiniMax 過去三年的技術(shù)路線,表面看是一連串孤立的賭注,實則暗藏著一條統(tǒng)一的邏輯線索:在資源受限的前提下,如何用更聰明的方式優(yōu)化,而非更多的算力堆砌,逼近 AGI 的上限。
當(dāng)行業(yè)還在卷文本時,MiniMax 做了一個在當(dāng)時看來極度冒險的決定:創(chuàng)業(yè)第一天就押注全模態(tài)。閆俊杰后來解釋說,他們一開始就想得很清楚,真正的 AGI 一定是多模態(tài)的輸入、多模態(tài)的輸出。
三年多前創(chuàng)業(yè)時完全沒有現(xiàn)成的技術(shù)路線,他們的策略就是每個模態(tài)至少先走通,等時機成熟再融合。這種堅持在當(dāng)時備受質(zhì)疑——業(yè)界主流認(rèn)為應(yīng)該先聚焦單一模態(tài)做到極致。
但閆俊杰的邏輯是,AGI 的本質(zhì)是多模態(tài)融合,如果現(xiàn)在不同步推進,等到需要融合時技術(shù)債會成為致命傷。這種非共識的堅持,讓 MiniMax 在 2025 年擁有了全球音頻第一、視頻第二、文本穩(wěn)坐第一梯隊的全模態(tài)能力。
![]()
前不久 OpenAI 的 Sora 2 通過多模態(tài)融合取得了顯著成果,這在一定程度上也印證了 MiniMax 早在創(chuàng)業(yè)初期就選擇這一技術(shù)路徑的前瞻性。
但更激進的是,閆俊杰在創(chuàng)業(yè)初期就打破了 AI 研究的傳統(tǒng)模式。
這是公司剛組建時打破的第一個認(rèn)知——把大模型做好這件事一定不能迷信之前的經(jīng)驗,得用第一性原理拆開來看。大概在四五年前,人工智能領(lǐng)域大家追求的是寫很多數(shù)學(xué)公式,把理論搞得很好、很花哨。 但這代人工智能最核心的其實就是 Scaling(縮放定律),就是讓它能夠用最簡單的方法把效果做得更好,并且隨著數(shù)據(jù)跟算力變多,效果就能夠持續(xù)往上漲。
閆俊杰的技術(shù)直覺源自 2014 年在百度的實習(xí)經(jīng)歷。那時 Anthropic 的 CEO Dario Amodei 也在百度實習(xí),正是在那里他發(fā)現(xiàn)了 Scaling Law 的雛形。
閆俊杰說,Scaling Law 其實在 2014 年做語音識別時就已經(jīng)被發(fā)現(xiàn)了,但真正被廣泛認(rèn)知是大概 2020 年左右。「六年前就有了,并且那件事發(fā)生在中國公司,所以后面的事就有點遺憾。」
這段往事讓閆俊杰意識到,中國并非沒有機會,而是錯失了把技術(shù)洞察轉(zhuǎn)化為產(chǎn)業(yè)優(yōu)勢的時機。
現(xiàn)實是殘酷的。閆俊杰很清楚中美之間的差距。他算過一筆賬:美國最好的公司的估值是中國創(chuàng)業(yè)公司的 100 倍,收入基本上也是 100 倍,但技術(shù)可能就領(lǐng)先 5%,花的錢大概是 50 到 100 倍之間。
那為什么中國的公司可以花他們 1/50 的錢就做出來效果,差距可能只差 5%?核心原因是中國的人才還是非常好的。而更關(guān)鍵的是,中國的算力比美國有很大差距,因此必須得用更加創(chuàng)新的方式,才有可能做到同樣的效果。 原則可能是一樣,但方法上,在每個模塊上其實都有很多創(chuàng)新。
算力限制不一定是詛咒,反而能成為倒逼創(chuàng)新的鞭子。
這就解釋了為什么 MiniMax 從 2023 年起就率先探索 MoE 架構(gòu),為什么在 2025 年敢于押注線性注意力機制,又為什么在 M2 模型中回歸全注意力機制。
每一次技術(shù)選擇,都是在有限資源下尋找質(zhì)量、速度、價格的三角平衡。
如果說 DeepSeek的邏輯是「用極致的工程優(yōu)化榨干每一分算力」,那么MiniMax 就是在通過算法突破和機制創(chuàng)新在有限資源中撬動更大可能。
一個穩(wěn)扎穩(wěn)打,一個劍走偏鋒。
![]()
其中一個出奇的創(chuàng)新, 是 MiniMax 在模型推理機制提出的「交錯思維(Interleaved Thinking)」,讓模型在「動手做事—停下來思考—再動手」的循環(huán)里推進任務(wù)。
這一新的機制很快推動了 OpenRouter、Ollama 等國外主流推理框架的適配支持,也帶動 Kimi 和 DeepSeek 等國內(nèi)模型陸續(xù)補齊類似能力。
但這些成果背后,更值得追問的是:一支沒有硅谷海歸坐鎮(zhèn)、被外界視作「草根」的團隊,如何做出全球領(lǐng)先的模型?
閆俊杰的回答出人意料。
AI 不是玄學(xué),而是可以被第一性原理拆解的工程問題,比如算法該怎么設(shè)計,數(shù)據(jù)的鏈路該怎么搭建,訓(xùn)練效率該怎么優(yōu)化,每個東西都有非常明確的目標(biāo)。
正是基于這一判斷,讓閆俊杰放棄了尋找「天才」,轉(zhuǎn)而相信科學(xué)方法論可以讓普通人發(fā)揮非凡價值。 他還提到,公司的海歸是不少的,但真正能起到關(guān)鍵作用的同學(xué),很多人基本上都是第一份工作。
在 MiniMax 會議室墻上有一行字——Intelligence with Everyone,這是閆俊杰創(chuàng)業(yè)的初衷,也是不少人選擇加入 MiniMax 的理由。
![]()
這行字今天也正在成為現(xiàn)實,全球超過兩百個國家和地區(qū)的用戶正在使用 MiniMax 的多模態(tài)模型,其中既有 2.12億用戶,也有 10 多萬企業(yè)和開發(fā)者來創(chuàng)造更多產(chǎn)品和服務(wù)。
非天才主義的 AI 掌舵人
如果說技術(shù)路線的非共識是顯性的,那么閆俊杰本人的成長軌跡,則是一場關(guān)于「反脆弱性」的修行。
閆俊杰出身河南小縣城,在資源極度匱乏的環(huán)境下培養(yǎng)了極強的自學(xué)能力。
上小學(xué)的時候自己會看很多書,而且這些書有可能不應(yīng)該是那個時間點的人來看的。比如很多高中甚至大學(xué)的書,上小學(xué)的時候提前就看。我爸爸是教初中的,就開始看初中的東西,上初中的時候就開始看高中的東西,高中的時候又開始學(xué)微積分,那些東西其實也沒有人教,就是自己看。
小學(xué)自學(xué)初中,高中自學(xué)微積分——這種不受環(huán)境限制、超前學(xué)習(xí)的特質(zhì),貫穿了閆俊杰的整個創(chuàng)業(yè)生涯。當(dāng)別人在等待導(dǎo)師指點時,他已經(jīng)通過第一性原理自我拆解問題;當(dāng)別人在抱怨資源不足時,他已經(jīng)通過極致的自學(xué)能力補上了差距。
但自學(xué)能力并不意味著一帆風(fēng)順。這和閆俊杰在商湯受到的「殘酷訓(xùn)練」不無關(guān)系。那時候他開始意識到要真正做一個最好的東西,就做了人臉識別,從倒數(shù)到第一大概花了一年半。
這一年半是非常痛苦的,每次技術(shù)測試都是倒數(shù)第幾名,這種煎熬足以擊垮大多數(shù)人。 但閆俊杰沒有放棄,反而從這段經(jīng)歷中提煉出了核心方法論:一定要做取舍,一定要選一些更加長期、能夠根本性發(fā)生變化的東西,而不是去做一些修補的東西。
經(jīng)歷這事之后,最核心的還是對自己這些最底層的判斷有信心。
這段磨煉鍛造了閆俊杰兩個關(guān)鍵特質(zhì):一是極致的取舍能力,愿意放棄短期修補,聚焦長期突破;二是極高的心理韌性,能夠承受長周期的失敗和質(zhì)疑。
這兩個特質(zhì),恰恰是 MiniMax 能夠在技術(shù)路線上堅持非共識這種近乎「佛系」的定力,讓閆俊杰在硅谷銀行危機、模型訓(xùn)練失敗等困境中都能保持冷靜。
中國 AI 的第三條路
MiniMax 的故事講到這里,一個更大的問題自然浮出水面:當(dāng)人才培養(yǎng)需要時間,技術(shù)追趕需要周期,中國 AI 公司靠什么在當(dāng)下就建立自己的生存空間?
MiniMax 不一定是標(biāo)準(zhǔn)答案,但閆俊杰倒是有三個創(chuàng)業(yè)至今一直堅持的原則:
第一,不做項目,只做用戶;第二,國內(nèi)海外同時做。
2022 年,國內(nèi)大廠還在觀望 AI 是否值得投入,創(chuàng)業(yè)公司普遍選擇 ToB 路徑(做項目、賣解決方案)以求快速變現(xiàn)。但閆俊杰選擇了最難的一條路:ToC,并且從第一天就瞄準(zhǔn)全球市場。

因此,閆俊杰選擇在海外更激烈的競爭中打磨技術(shù),而非卷入國內(nèi)與巨頭的流量爭奪。事實證明,這是正確的——MiniMax 在海外市場的 DAU 和付費率都維持在健康區(qū)間,而這正在成為它的護城河。
但最難的,是第三個原則:技術(shù)驅(qū)動 vs 用戶增長。
這是對所有 AI 創(chuàng)業(yè)公司的終極拷問。閆俊杰坦白也糾結(jié)過,最終選擇了前者,哪怕這意味著短期數(shù)據(jù)的犧牲、中層的流失和外界的質(zhì)疑。
通過模型能力推動產(chǎn)品和業(yè)務(wù)發(fā)展,或者通過移動互聯(lián)網(wǎng)時代的增長方式來發(fā)展,兩者有可能都是對的,但它們是沒法共存的。最后我們發(fā)現(xiàn)技術(shù)驅(qū)動的這種方式才適合我們。
在技術(shù)驅(qū)動的戰(zhàn)略下,閆俊杰做出另外一個關(guān)鍵選擇:開源。
年初 DeepSeek R1 橫空出世后不久,閆俊杰曾表示,如果可以重新選,應(yīng)該第一天就開源。在和羅永浩的對談里他再次談到開源。 實際上開源這件事,在手機操作系統(tǒng)上其實都發(fā)生過。蘋果是閉源的,安卓是開源的,第二名后面的人必須得開源才有自己的獨特定位,才能發(fā)出新的生態(tài)。
為了讓我們能夠進展,需要別人有選擇我們的理由,模型的開放性恰好是一個非常重要的理由,因為它可以讓你有足夠強的技術(shù)信任,知道你的研發(fā)能力,也愿意更加深度來合作。
而 MiniMax 也延續(xù)著 DeepSeek 掀起的開源浪潮, MiniMax M2 發(fā)布后,大模型分析平臺 Artificial Analysis 是這樣介紹的:
中國 AI 實驗室在開源領(lǐng)域持續(xù)保持領(lǐng)先地位。 MiniMax 的發(fā)布延續(xù)了中國 AI 在開源領(lǐng)域的領(lǐng)先地位,這一地位由 DeepSeek 在 2024 年底開啟,并由 DeepSeek 的后續(xù)發(fā)布、阿里巴巴、智譜、和 Kimi 等公司持續(xù)保持。
![]()
最近全球模型聚合平臺 OpenRouter 聯(lián)合a16z 發(fā)布了一份報告 State of AI 的100 Trillion Tokens ,可以看到 M2 開源之后,快速受到了全球開發(fā)者歡迎和采納。
中國開源模型在全球使用量占比從 2024 年初的 1.2%,現(xiàn)在這個數(shù)字已經(jīng)飆升至 30%,全球開源生態(tài)的重心已經(jīng)向中國傾斜。
但這場競賽遠(yuǎn)未結(jié)束。閆俊杰的判斷是,算力和芯片的物理限制,決定了模型參數(shù)量和成本是有天花板的。在一個有限的參數(shù)量的情況下,不同的人來做不同的取舍,就一定會有些不一樣的成果。
AI 不會一家獨大,但也不會百家爭鳴,最終會收斂到少數(shù)幾家基于不同取舍的共存格局。
羅永浩關(guān)于「中國錯失 GPT-3.5」的追問,閆俊杰展現(xiàn)出了一種務(wù)實的樂觀。他表示把技術(shù)做好最重要的東西,說到底其實是兩個詞,一個是想象力,一個是自信。
美國那些企業(yè)很多浪潮是他們引領(lǐng)的,所以有自信在,要引領(lǐng)這個行業(yè)。在中國有些產(chǎn)業(yè)里面其實也是這樣的,比如通訊、還有其他領(lǐng)域。 至少人工智能這個行業(yè)目前還沒有到引領(lǐng)這個地步,但這個事情已經(jīng)越來越具備了。
這或許就是中國 AI 公司需要走出的第三條路:
用更聰明的架構(gòu)設(shè)計,對抗算力差距;
通過科學(xué)的組織進化,培養(yǎng) AI 原生人才 ;
在夾縫中長出自己的形狀,而非附庸于巨頭。
MiniMax 的故事還在繼續(xù),中國 AI 的篇章墨跡尚未干。勝負(fù)不由起跑線決定,而由你選擇在哪條路上、用什么樣的節(jié)奏、堅持多久來定義。
閆俊杰在訪談中說道:
再往后三年看,即使不是我們,也會有中國其他的人能夠做到這件事。
三年后,會是誰?又會用怎樣的方式?
沒有一部續(xù)集如此令人期待,因為我們都會是其中的角色。





京公網(wǎng)安備 11011402013531號