當(dāng)前位置：首頁 ? 資訊 ? 新科技 ? 正文

MiniMax 閆俊杰和羅永浩四小時訪談：走出中國 AI 的第三條路，大山并非不可翻越

IP屬地中國·北京 愛范兒 時間：2025-12-11 12:21:36

當(dāng)整個 AI 圈都在為 DAU（日活躍用戶數(shù)）和融資額焦慮時，MiniMax 創(chuàng)始人閆俊杰卻表現(xiàn)出一種近乎冷酷的淡漠。
坐在羅永浩對面的閆俊杰，并不像一位掌管著 AI 獨角獸企業(yè)的技術(shù)新貴。

他拒絕談?wù)摳淖兪澜纾炊钩锌謶帧Ｄ欠N恐懼不是來自商業(yè)競爭，而是來自技術(shù)本身——當(dāng)模型的能力開始超越人類時，創(chuàng)造者反而成了最先感到不安的人。
只要是一個東西能被量化，模型就一定會強于人，或者一定是能到最好的人類的那一檔水平。所有做得比較成功的模型，在做出來之前都會有點害怕。
據(jù)晚點采訪，在 MiniMax 內(nèi)部，互聯(lián)網(wǎng)行業(yè)奉為圭臬的 DAU ，被閆俊杰直接定義為「虛榮指標(biāo)」。
在巨頭環(huán)伺、算力短缺、熱錢褪去的 2025 年，MiniMax 正在進行一場關(guān)于認(rèn)知的修正：不再沿用移動互聯(lián)網(wǎng)的邏輯，即通過大規(guī)模投放換取增長、通過堆砌功能留住用戶，而是回歸本質(zhì)：把模型當(dāng)作最重要的產(chǎn)品。
在大模型時代，真正的產(chǎn)品其實是模型本身，傳統(tǒng)意義上的產(chǎn)品更像是一個渠道。如果模型不夠聰明，產(chǎn)品做得再好也沒有用。
在羅永浩和閆俊杰這期對談里，我發(fā)現(xiàn) MiniMax 這家 AI 公司從創(chuàng)業(yè)第一天就選擇了注定與主流背道而馳的技術(shù)路徑。
當(dāng)所有人都試圖尋找中國的 OpenAI 和 Sam Altman 時，閆俊杰卻在試圖證明「非天才」的價值。MiniMax 的故事不是關(guān)于天才的靈光乍現(xiàn)，而是一場關(guān)于如何在資源受限的縫隙中，通過極度理性地計算與修正，撕開一道通往 AGI 窄門的精密實驗。
用 1/50 的籌碼通往 AGI
MiniMax 過去三年的技術(shù)路線，表面看是一連串孤立的賭注，實則暗藏著一條統(tǒng)一的邏輯線索：在資源受限的前提下，如何用更聰明的方式優(yōu)化，而非更多的算力堆砌，逼近 AGI 的上限。
當(dāng)行業(yè)還在卷文本時，MiniMax 做了一個在當(dāng)時看來極度冒險的決定：創(chuàng)業(yè)第一天就押注全模態(tài)。閆俊杰后來解釋說，他們一開始就想得很清楚，真正的 AGI 一定是多模態(tài)的輸入、多模態(tài)的輸出。
三年多前創(chuàng)業(yè)時完全沒有現(xiàn)成的技術(shù)路線，他們的策略就是每個模態(tài)至少先走通，等時機成熟再融合。這種堅持在當(dāng)時備受質(zhì)疑——業(yè)界主流認(rèn)為應(yīng)該先聚焦單一模態(tài)做到極致。
但閆俊杰的邏輯是，AGI 的本質(zhì)是多模態(tài)融合，如果現(xiàn)在不同步推進，等到需要融合時技術(shù)債會成為致命傷。這種非共識的堅持，讓 MiniMax 在 2025 年擁有了全球音頻第一、視頻第二、文本穩(wěn)坐第一梯隊的全模態(tài)能力。

前不久 OpenAI 的 Sora 2 通過多模態(tài)融合取得了顯著成果，這在一定程度上也印證了 MiniMax 早在創(chuàng)業(yè)初期就選擇這一技術(shù)路徑的前瞻性。
但更激進的是，閆俊杰在創(chuàng)業(yè)初期就打破了 AI 研究的傳統(tǒng)模式。
這是公司剛組建時打破的第一個認(rèn)知——把大模型做好這件事一定不能迷信之前的經(jīng)驗，得用第一性原理拆開來看。大概在四五年前，人工智能領(lǐng)域大家追求的是寫很多數(shù)學(xué)公式，把理論搞得很好、很花哨。但這代人工智能最核心的其實就是 Scaling（縮放定律），就是讓它能夠用最簡單的方法把效果做得更好，并且隨著數(shù)據(jù)跟算力變多，效果就能夠持續(xù)往上漲。
閆俊杰的技術(shù)直覺源自 2014 年在百度的實習(xí)經(jīng)歷。那時 Anthropic 的 CEO Dario Amodei 也在百度實習(xí)，正是在那里他發(fā)現(xiàn)了 Scaling Law 的雛形。
閆俊杰說，Scaling Law 其實在 2014 年做語音識別時就已經(jīng)被發(fā)現(xiàn)了，但真正被廣泛認(rèn)知是大概 2020 年左右。「六年前就有了，并且那件事發(fā)生在中國公司，所以后面的事就有點遺憾。」
這段往事讓閆俊杰意識到，中國并非沒有機會，而是錯失了把技術(shù)洞察轉(zhuǎn)化為產(chǎn)業(yè)優(yōu)勢的時機。
現(xiàn)實是殘酷的。閆俊杰很清楚中美之間的差距。他算過一筆賬：美國最好的公司的估值是中國創(chuàng)業(yè)公司的 100 倍，收入基本上也是 100 倍，但技術(shù)可能就領(lǐng)先 5%，花的錢大概是 50 到 100 倍之間。
那為什么中國的公司可以花他們 1/50 的錢就做出來效果，差距可能只差 5%？核心原因是中國的人才還是非常好的。而更關(guān)鍵的是，中國的算力比美國有很大差距，因此必須得用更加創(chuàng)新的方式，才有可能做到同樣的效果。原則可能是一樣，但方法上，在每個模塊上其實都有很多創(chuàng)新。
算力限制不一定是詛咒，反而能成為倒逼創(chuàng)新的鞭子。
這就解釋了為什么 MiniMax 從 2023 年起就率先探索 MoE 架構(gòu)，為什么在 2025 年敢于押注線性注意力機制，又為什么在 M2 模型中回歸全注意力機制。
每一次技術(shù)選擇，都是在有限資源下尋找質(zhì)量、速度、價格的三角平衡。
如果說 DeepSeek的邏輯是「用極致的工程優(yōu)化榨干每一分算力」，那么MiniMax 就是在通過算法突破和機制創(chuàng)新在有限資源中撬動更大可能。
一個穩(wěn)扎穩(wěn)打，一個劍走偏鋒。

其中一個出奇的創(chuàng)新，是 MiniMax 在模型推理機制提出的「交錯思維（Interleaved Thinking）」，讓模型在「動手做事—停下來思考—再動手」的循環(huán)里推進任務(wù)。
這一新的機制很快推動了 OpenRouter、Ollama 等國外主流推理框架的適配支持，也帶動 Kimi 和 DeepSeek 等國內(nèi)模型陸續(xù)補齊類似能力。
但這些成果背后，更值得追問的是：一支沒有硅谷海歸坐鎮(zhèn)、被外界視作「草根」的團隊，如何做出全球領(lǐng)先的模型？
閆俊杰的回答出人意料。
AI 不是玄學(xué)，而是可以被第一性原理拆解的工程問題，比如算法該怎么設(shè)計，數(shù)據(jù)的鏈路該怎么搭建，訓(xùn)練效率該怎么優(yōu)化，每個東西都有非常明確的目標(biāo)。
正是基于這一判斷，讓閆俊杰放棄了尋找「天才」，轉(zhuǎn)而相信科學(xué)方法論可以讓普通人發(fā)揮非凡價值。他還提到，公司的海歸是不少的，但真正能起到關(guān)鍵作用的同學(xué)，很多人基本上都是第一份工作。
在 MiniMax 會議室墻上有一行字——Intelligence with Everyone，這是閆俊杰創(chuàng)業(yè)的初衷，也是不少人選擇加入 MiniMax 的理由。

這行字今天也正在成為現(xiàn)實，全球超過兩百個國家和地區(qū)的用戶正在使用 MiniMax 的多模態(tài)模型，其中既有 2.12億用戶，也有 10 多萬企業(yè)和開發(fā)者來創(chuàng)造更多產(chǎn)品和服務(wù)。
非天才主義的 AI 掌舵人
如果說技術(shù)路線的非共識是顯性的，那么閆俊杰本人的成長軌跡，則是一場關(guān)于「反脆弱性」的修行。
閆俊杰出身河南小縣城，在資源極度匱乏的環(huán)境下培養(yǎng)了極強的自學(xué)能力。
上小學(xué)的時候自己會看很多書，而且這些書有可能不應(yīng)該是那個時間點的人來看的。比如很多高中甚至大學(xué)的書，上小學(xué)的時候提前就看。我爸爸是教初中的，就開始看初中的東西，上初中的時候就開始看高中的東西，高中的時候又開始學(xué)微積分，那些東西其實也沒有人教，就是自己看。
小學(xué)自學(xué)初中，高中自學(xué)微積分——這種不受環(huán)境限制、超前學(xué)習(xí)的特質(zhì)，貫穿了閆俊杰的整個創(chuàng)業(yè)生涯。當(dāng)別人在等待導(dǎo)師指點時，他已經(jīng)通過第一性原理自我拆解問題；當(dāng)別人在抱怨資源不足時，他已經(jīng)通過極致的自學(xué)能力補上了差距。
但自學(xué)能力并不意味著一帆風(fēng)順。這和閆俊杰在商湯受到的「殘酷訓(xùn)練」不無關(guān)系。那時候他開始意識到要真正做一個最好的東西，就做了人臉識別，從倒數(shù)到第一大概花了一年半。
這一年半是非常痛苦的，每次技術(shù)測試都是倒數(shù)第幾名，這種煎熬足以擊垮大多數(shù)人。但閆俊杰沒有放棄，反而從這段經(jīng)歷中提煉出了核心方法論：一定要做取舍，一定要選一些更加長期、能夠根本性發(fā)生變化的東西，而不是去做一些修補的東西。
經(jīng)歷這事之后，最核心的還是對自己這些最底層的判斷有信心。
這段磨煉鍛造了閆俊杰兩個關(guān)鍵特質(zhì)：一是極致的取舍能力，愿意放棄短期修補，聚焦長期突破；二是極高的心理韌性，能夠承受長周期的失敗和質(zhì)疑。
這兩個特質(zhì)，恰恰是 MiniMax 能夠在技術(shù)路線上堅持非共識這種近乎「佛系」的定力，讓閆俊杰在硅谷銀行危機、模型訓(xùn)練失敗等困境中都能保持冷靜。
中國 AI 的第三條路
MiniMax 的故事講到這里，一個更大的問題自然浮出水面：當(dāng)人才培養(yǎng)需要時間，技術(shù)追趕需要周期，中國 AI 公司靠什么在當(dāng)下就建立自己的生存空間?
MiniMax 不一定是標(biāo)準(zhǔn)答案，但閆俊杰倒是有三個創(chuàng)業(yè)至今一直堅持的原則：
第一，不做項目，只做用戶；第二，國內(nèi)海外同時做。
2022 年，國內(nèi)大廠還在觀望 AI 是否值得投入，創(chuàng)業(yè)公司普遍選擇 ToB 路徑（做項目、賣解決方案）以求快速變現(xiàn)。但閆俊杰選擇了最難的一條路：ToC，并且從第一天就瞄準(zhǔn)全球市場。

因此，閆俊杰選擇在海外更激烈的競爭中打磨技術(shù)，而非卷入國內(nèi)與巨頭的流量爭奪。事實證明，這是正確的——MiniMax 在海外市場的 DAU 和付費率都維持在健康區(qū)間，而這正在成為它的護城河。
但最難的，是第三個原則：技術(shù)驅(qū)動 vs 用戶增長。
這是對所有 AI 創(chuàng)業(yè)公司的終極拷問。閆俊杰坦白也糾結(jié)過，最終選擇了前者，哪怕這意味著短期數(shù)據(jù)的犧牲、中層的流失和外界的質(zhì)疑。
通過模型能力推動產(chǎn)品和業(yè)務(wù)發(fā)展，或者通過移動互聯(lián)網(wǎng)時代的增長方式來發(fā)展，兩者有可能都是對的，但它們是沒法共存的。最后我們發(fā)現(xiàn)技術(shù)驅(qū)動的這種方式才適合我們。
在技術(shù)驅(qū)動的戰(zhàn)略下，閆俊杰做出另外一個關(guān)鍵選擇：開源。
年初 DeepSeek R1 橫空出世后不久，閆俊杰曾表示，如果可以重新選，應(yīng)該第一天就開源。在和羅永浩的對談里他再次談到開源。實際上開源這件事，在手機操作系統(tǒng)上其實都發(fā)生過。蘋果是閉源的，安卓是開源的，第二名后面的人必須得開源才有自己的獨特定位，才能發(fā)出新的生態(tài)。
為了讓我們能夠進展，需要別人有選擇我們的理由，模型的開放性恰好是一個非常重要的理由，因為它可以讓你有足夠強的技術(shù)信任，知道你的研發(fā)能力，也愿意更加深度來合作。
而 MiniMax 也延續(xù)著 DeepSeek 掀起的開源浪潮， MiniMax M2 發(fā)布后，大模型分析平臺 Artificial Analysis 是這樣介紹的：
中國 AI 實驗室在開源領(lǐng)域持續(xù)保持領(lǐng)先地位。 MiniMax 的發(fā)布延續(xù)了中國 AI 在開源領(lǐng)域的領(lǐng)先地位，這一地位由 DeepSeek 在 2024 年底開啟，并由 DeepSeek 的后續(xù)發(fā)布、阿里巴巴、智譜、和 Kimi 等公司持續(xù)保持。

最近全球模型聚合平臺 OpenRouter 聯(lián)合a16z 發(fā)布了一份報告 State of AI 的100 Trillion Tokens ，可以看到 M2 開源之后，快速受到了全球開發(fā)者歡迎和采納。
中國開源模型在全球使用量占比從 2024 年初的 1.2%，現(xiàn)在這個數(shù)字已經(jīng)飆升至 30%，全球開源生態(tài)的重心已經(jīng)向中國傾斜。
但這場競賽遠(yuǎn)未結(jié)束。閆俊杰的判斷是，算力和芯片的物理限制，決定了模型參數(shù)量和成本是有天花板的。在一個有限的參數(shù)量的情況下，不同的人來做不同的取舍，就一定會有些不一樣的成果。
AI 不會一家獨大，但也不會百家爭鳴，最終會收斂到少數(shù)幾家基于不同取舍的共存格局。
羅永浩關(guān)于「中國錯失 GPT-3.5」的追問，閆俊杰展現(xiàn)出了一種務(wù)實的樂觀。他表示把技術(shù)做好最重要的東西，說到底其實是兩個詞，一個是想象力，一個是自信。
美國那些企業(yè)很多浪潮是他們引領(lǐng)的，所以有自信在，要引領(lǐng)這個行業(yè)。在中國有些產(chǎn)業(yè)里面其實也是這樣的，比如通訊、還有其他領(lǐng)域。至少人工智能這個行業(yè)目前還沒有到引領(lǐng)這個地步，但這個事情已經(jīng)越來越具備了。
這或許就是中國 AI 公司需要走出的第三條路：
用更聰明的架構(gòu)設(shè)計，對抗算力差距；
通過科學(xué)的組織進化，培養(yǎng) AI 原生人才；
在夾縫中長出自己的形狀，而非附庸于巨頭。
MiniMax 的故事還在繼續(xù)，中國 AI 的篇章墨跡尚未干。勝負(fù)不由起跑線決定，而由你選擇在哪條路上、用什么樣的節(jié)奏、堅持多久來定義。
閆俊杰在訪談中說道：
再往后三年看，即使不是我們，也會有中國其他的人能夠做到這件事。
三年后，會是誰?又會用怎樣的方式？
沒有一部續(xù)集如此令人期待，因為我們都會是其中的角色。

免責(zé)聲明：本網(wǎng)信息來自于互聯(lián)網(wǎng)，目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點。其內(nèi)容真實性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系我們，本站將會在24小時內(nèi)處理完畢。

同類資訊

Windows 11任務(wù)欄至今仍無法自由移動！微軟終于給出原因：沒用舊代碼

東安動力首臺轉(zhuǎn)子發(fā)動機R05E點火成功，2027年量產(chǎn)

挑戰(zhàn)液態(tài)海洋共識：NASA研究稱土衛(wèi)六含太陽系最大“冰沙”

曝TikTok交易達成，美國和字節(jié)跳動各掌握一家公司

AI賦能流程神州數(shù)碼汽車行業(yè)AI 應(yīng)用落地研討會在滬舉辦

希迪智駕港交所上市，成港股首家商用車智能駕駛公司

全站最新

Windows 11任務(wù)欄至今仍無法自由移動！微軟終于給出原因：沒用舊代碼

東安動力首臺轉(zhuǎn)子發(fā)動機R05E點火成功，2027年量產(chǎn)

挑戰(zhàn)液態(tài)海洋共識：NASA研究稱土衛(wèi)六含太陽系最大“冰沙”

曝TikTok交易達成，美國和字節(jié)跳動各掌握一家公司

熱門推薦

基于阿里千問，烏干達打造本土大模型

比亞迪正式進入伊拉克市場，推出BYD SHARK 6

金沙酒業(yè)營銷負(fù)責(zé)人更迭，王維龍離職，韓玉國接棒

Windows 11任務(wù)欄至今仍無法自由移動！微軟終于給出原因：沒用舊代碼

東安動力首臺轉(zhuǎn)子發(fā)動機R05E點火成功，2027年量產(chǎn)

挑戰(zhàn)液態(tài)海洋共識：NASA研究稱土衛(wèi)六含太陽系最大“冰沙”

曝TikTok交易達成，美國和字節(jié)跳動各掌握一家公司

AI賦能流程神州數(shù)碼汽車行業(yè)AI 應(yīng)用落地研討會在滬舉辦

希迪智駕港交所上市，成港股首家商用車智能駕駛公司

千問App辟謠：全員大會集體吃豆包圖是AI生成的

你的“大廠經(jīng)驗”，在AI面前可能一文不值

科學(xué)與健康|改寫生命演化史！2025我國古生物學(xué)研究在多領(lǐng)域取得突破

他設(shè)計的手機賣了1.5億臺 | 我們的四分之一世紀(jì)

VEX機器人亞洲公開賽在京開幕，全球近30國青少年選手參賽

拼多多：趙佳臻獲任聯(lián)席董事長，與陳磊共同擔(dān)任集團聯(lián)席董事長兼聯(lián)席CEO