![]()
作者 | 駱軼航
郵箱 | tluo@pingwest.com
“中國的OpenAI” 是誰?一眾媒體和分析機構給出的答案是:智譜。
這家中國的大模型 AI 創業公司正在港交所沖刺 IPO。在招股說明書中,它明確宣稱:“2025年6月,智譜被美國OpenAI 列為全球主要競爭對手。”
畢竟,OpenAI 開啟了生成式人工智能的大規模普及。只要做大模型,或多或少都會沾上 OpenAI 的影子。一個非常劃算的方式是:照貓畫虎、形而上學地模仿 OpenAI,這是獲得“中國的OpenAI” 加冕最容易的方式。
那么,誰是中國的 Anthropic?
表面上,誰有自己的基座模型,編程能力強,誰把基座模型和 Agent 能力整合在一起,誰先推出了類似 Computer Use 的功能,誰就應該是中國的 Anthropic。
但真的是這樣么?Anthropic 就是這么回事么?
請讓我給出關于誰最像 Anthropic 的答案,一個顛覆三觀的答案:MiniMax。
MiniMax 是另一家近期在港交所沖刺 IPO 的中國大模型 AI 公司。表面上看,MiniMax 的收入 70% 來自 C 端用戶,而 Anthropic 的收入絕大多數來自 B 端;MiniMax 有從語音到視頻再到文本的全模態模型矩陣,而 Anthropic 旗下的 Claude 專注于文本和編程,它們風馬牛不相及。
但其實,它們真的很像。
1
“沒有標簽”
Anthropic 和 MiniMax 最像的一點是:沒有標簽。創始人沒有,公司也不太有。
2021年,Dario Amodei 帶著幾個 OpenAI 的同事出走創立了 Anthropic。他們離開的原因,是對 OpenAI 商業化路線的不滿——在 AI 安全問題還未解決的情況下,OpenAI 把 GPT-3 交給微軟使用,這種逐漸商業化以及對創始初心的背離,讓這群技術理想主義者決定“另起爐灶”。
Dario Amodei 在 OpenAI 是研究副總裁,標準的技術主管職位。它不是 Sam Altman 那種 spotlight position(聚光燈下的角色)。在他拿到生物物理學博士學位后,先在百度硅谷 AI 實驗室工作,后來加入 Google 做語音識別,2016年才進入 OpenAI 。其實你很難給 Dario Amodei 貼上精確的標簽:物理學博士?前 OpenAI 高管? AI 安全專家?
都對,但都不夠準確,也非常不鮮明。
同是在2021年,閆俊杰從商湯離職創立 MiniMax。他在商湯也是副總裁,同時兼任研究院副院長和智慧城市事業群CTO,也是標準的技術主管,沒有湯曉鷗那種創始人的閃耀光環,甚至連個“洋博士”都不是(在中科院自動化所獲得的博士學位)。在跟羅永浩的對談里,他說“我們是比較草根的團隊,沒啥背景”,誠不人欺也。
這類技術主管出身的“準二號位”創業,有個共同特點:技術能力扎實,但缺少“領袖魅力”的訓練,個人形象模糊,沒有標簽,不擅長翻云覆雨,更喜歡刨根問底,追求可解釋性,而非炸裂效應。
我們用他們對比一下同時期那些標簽打得锃光瓦亮的創業者——
OpenAI CEO Sam Altman,連續創業者,曾擔任全世界最大的創業孵化器 Y Combinator 的總裁,天生的聚光燈追逐者,擅長講故事,熱衷造勢,硅谷人脈中樞,權力斗爭達人,這些都能讓人們記住。
月之暗面 (Kimi)創始人楊植麟:清華姚班本科,CMU 博士,師從蘋果 AI 負責人 Ruslan Salakhutdinov,30歲出頭,“天才創業者”標簽人盡皆知,還是個搖滾樂手,文藝青年。就連 Kimi 的模型也有標簽:“超長上下文”。
但 Dario Amodei 和閆俊杰,你很難用一句話說清楚他們是誰,他們的性格特質都在顯性上模糊,很難被人一句話總結出來。他們在鏡頭前面表情平淡,語速緩慢,談及技術細節時偶有激動,并不適合提煉“金句”。他們的公司在做什么,也很難一句話說明。
MiniMax 是什么?視頻生成?多模態?Agent?它都做,說不清哪個是主要產品。海螺 AI、星野、Talkie 三個 C 端產品,針對不同市場,都有不少用戶,但留給用戶的記憶點并不鮮明。技術上,M2 曾躋身開源模型排行榜第一,社區好評如潮,但你問10個業界人士“MiniMax是干什么的”,答案肯定是不一樣的。
Anthropic 也一樣。很多人說它不是做 coding 的么?這就跟說 MiniMax 是做多模態的一樣,屬于看似精確,實則錯誤和不完整的強行標簽。Anthropic 在最引以為傲的編程領域的收入并不及賣企業 API 的收入。問題企業怎么用 Anthropic?這也太不直觀了,反正 Claude 在 C 端的影響力遠不及 ChatGPT 和 Gemini,它究竟是什么,就很難打上標簽。
“沒有標簽” 在公眾形象上是個問題,它讓 Anthropic 和 MiniMax 的品牌形象很難溢出。
但是另一方面,“沒有標簽” 反而是它們最突出的標簽。時間越長,“沒有標簽” 這個標簽,就越有它的價值。
因為,“沒有標簽” 是今天大模型——特別是語言模型進化的趨勢。模型能力從長期看正在收斂,每一家的突出優勢都可能在未來幾個月被另一個競爭對手突破和顛覆。
曾被廣為看好的“開源之光” —— meta 旗下的 Llama 一夜之間被 DeepSeek 和 Qwen 按在地上摩擦;兩年前備受奚落的 Google 憑借 Gemini 3 拉響 OpenAI 的紅色警報,成為全球模型之冠。DeepSeek 和 Google 的優勢能一直保持么?天知道。
在這種情形下,“沒有標簽”就意味著人設不會破,就意味著外界對它不會有太高或太低的預期,就意味著輕易不會被打臉,不會從云端到地獄再到云端坐過山車……“沒有標簽” ,其實越來越是一種安全感和確定性的來源。
看 Claude,它有經歷過口碑的大翻車和鳳凰涅槃么?人們甚至不會特別期待 Claude 5,對吧?但無論是 Claude 4.5 Sonnet 還是 Claude 4.5 Opus,人們還是很踴躍在用,但“炸裂”程度遠不如 Gemini 3。MiniMax 從 01 到 M1 再到 M2,開源社區的口碑一路走高,OpenRouter 公布的調用量擺在那兒,高過了很多更擅長在社交媒體上“刷屏”的開源模型。
這其實是一個非常微妙,但恰到好處的狀態。它是一種非常“得體”的預期管理,尤其對一家越來越走向公眾的公司而言。
在平衡損益表面前,“進步” 和 “增長” 是最值得期待的,而“炸裂” 和 “翻車”則不是。“沒有標簽”,反而應該成為它們最重要的標簽。
1
追求技術的可解釋性
2025年10月,MiniMax 創始人和 CEO 閆俊杰在 MiniMax 官方微信公眾號上發表了一篇技術長文《為什么MiniMax M2是一個 Full Attention 模型》。
從 text 01 到 M1 再到 M2,MiniMax 在模型預訓練上,從力推線性注意力機制(Lightning Attention),重歸傳統的全面注意力機制(Full Attention),背后是因為團隊發現線性注意力機制帶來的不錯的模型效果背后的代價是:復雜多跳推理任務有明顯缺陷。
隨著模型與通用 Agent 在功能上日趨接近,“在 Agent場景下,模型需要跨多個工具、跨上下文反復驗證與調整。Hybrid Attention 雖然省算力,但容易造成上下文信息缺失,導致邏輯中斷”,閆俊杰在文章中坦承了這點,點明了 MiniMax M2 重新回歸 Full Attention 機制的原因。
這種 CEO 公開承認技術路線試錯的做法,極為罕見。這讓我馬上想起了 Anthropic CEO Dario Amodei 今年4月在自己的博客上發表的另一篇長文《The Urgency of Interpretability》(可解釋性的緊迫性)。
在這篇文章里,Dario Amodei 強調了生成式 AI 的不透明問題,他認為模型的能力是“生長”而非“構建”出來的,與傳統軟件有著本質的區別。這種不透明性導致 AI 的很多安全和道德風險無法被預測,因此迫切需要 AI 系統的可解釋性研究。
重要的是,在這篇長文里,Dario Amodei 公開承認了此前被他奉為圭臬的 “Constitutional AI”(憲法式 AI)的局限性,他認為 Constitional AI 只能讓模型“裝作”遵循了安全原則和對齊意圖,但內心可能另有“想法”。
因此,放棄將 Constitutional AI 作為安全對齊的圭臬,系統轉向模型的可解釋性研究是必要的,Anthropic 新的目標是:2027年實現用可解釋性可靠地檢測大多數模型問題。
這也是一次公開解釋重大技術路線試錯的行動。無論是 Dario Amodei 還是閆俊杰,他們這類解釋文章都很長,技術細節都很多,作為公關傳播素材非常不適合提煉“金句”和標題,但它們對理解一家從事大模型基礎研發的公司的第一性原理,又十分重要。
Dario Amodei 關于可解釋性的長文,本身就在追求技術的可解釋性。他之前針對 DeepSeek 崛起的萬字長文也是,反傳統思維地提出了 V3 比 R1 模型更具挑戰性的觀點,詳細剖解了這兩款模型的技術差異。MiniMax 的掌舵者閆俊杰也一樣,他非常想讓外界了解為什么 MiniMax 回到了 Full Attention 機制,覺得解釋不清楚這個問題不行,其實外界未必關心這個問題——牛 X 不就完了么。
而對這兩位在技術一線的 CEO 而言,寫長文進行技術反思和解釋,意味著什么?
意味著他們需要說服自己,而不只是說服投資人和用戶;意味著他們相信透明比神秘感更重要;意味著他們愿意承認“我們之前錯了”,然后公開自己的技術探索方法。
這在快節奏的 AI 競賽中是非常奢侈的。
你完全可以想象 Sam Altman 和 Elon Musk 在這種情形下會怎么做:直接發新模型,突出性能上特別強大的地方,用刷新 benchmark 亮瞎你的雙眼,完全拿結果說話,不解釋技術路線問題,或輕描淡寫,讓負責研究或訓練的副手解釋一下。
但畢竟有創始人和 CEO 愿意站出來,詳細解釋技術細節。
追求技術的可解釋性和透明性,會讓一家公司在更長的時期,贏得客戶的信賴。客戶愿意看到一家大模型公司“笨”的一面,它比“神奇”重要。
1
笨架構與好商業
與追求技術可解釋性有點對立的,就是在大眾領域的傳播,這點 Anthropic 和 MiniMax 都不太擅長。
Anthropic 曾經在舊金山機場密集鋪了一段時間 Claude 模型的廣告,強調它的安全,但幾個月之后就消失了。MiniMax 也為旗下的陪伴應用 Talkie 和視頻生成工具海螺投放過一些在 X 和 YouTube 上的廣告,但并不持續。
OpenAI 可能不投廣告,但 Sam Altman 在社交網絡和各種訪談里的非技術暴論高強度輸出足夠了。我曾經在一條 YouTube 節目內容的開篇看到了先后兩條廣告——分別來自 Gemini 3 和 K2,你得承認 YouTube 算法推薦真是夠精準的,也得承認是真有人在使勁砸廣告。在國內,豆包、千問……就不說了。
Anthropic 和 MiniMax 應該屬于一開始“定力不足”,試了一下就縮回來,然后想明白了,就不再大張旗鼓地做的那種。
對這個事,MiniMax CEO 閆俊杰有自己的解釋。在訪談中,閆俊杰說:“過去三年,AI 創新的主陣地是 Web,不是手機 APP。國際上前十的產品,除了中國的豆包,其他都是先做 Web,靠自然量起來的。能靠不買量做起來的,只有Web端”。
言下之意,就是 MiniMax 不靠買量做 C 端爆款,不靠炒作聲量,專注技術迭代。這在中國 AI 創業環境里是挺“笨”的做法。
但這使得MiniMax可能是今天最重視可持續經營的模型公司之一,它的招股書披露,其現金儲備有超過11億美元,簡單換算,這筆錢可以讓它用上53個月。而它目前5億美金的虧損規模,其實都不及一些c端大廠AI產品一年用來投流的錢。
還有更“笨”的做法。
2023年下半年,大部分中國 AI 公司還在做稠密模型(更穩健),MiniMax 把80%的算力 all-in 到 MoE 上(更不確定)。MiniMax 的投資人、明勢資本創始合伙人黃明明回憶說:“前兩次失敗了,直到第三次成功,他(指閆俊杰)才跑來告訴我們。我問他為什么賭這么大?賭不出來公司就掛了。”
閆俊杰的回答是:“只有做出 MoE,才能用更低成本向更高階段演進。否則用的是不可估量的成本,沒有一家公司能支持”。
MiniMax 在技術架構的探索上是有非常強的執念的:2023年到2024年上半年,它深耕 MoE,控制模型演進的成本;2024年下半年到2025年初,它強力探索線性注意力機制,啟動開源戰略;2025年中開始,它側重推理優化與工程優化,回歸全面注意力機制。
至于它在跨模態領域展現的模型能力——從語音(Speech-02-HD)和視頻(Hailuo-02)領域達到的頂尖水平,到如今 M2 在文本和代碼領域的突破,其實是它基于基礎架構持續的探索與適配之下打磨的一整套瑞士軍刀。
實在不是牽強附會,MiniMax 在架構上基于第一性原理(成本與性能的平衡)的探索,與 Anthropic 的技術路徑摸索有很多相似的地方。
2021年-2023年,Anthropic 側重單一的“安全”,2023年3月才發布第一代“安全”模型;2024年,它通過 Claude 3 家族迅速建立了匹敵 GPT-4 的模型競爭能力,突破“安全”的桎梏,在產品化上大刀闊斧;2024年底,它將 Agent 與模型推理能力視作戰略重心,先是MCP,再是Skill,成為 AI Agent 的標準建立者。甚至基于 Agent 能力的需求,探索從 Constitutional AI,向可解釋性 AI 原理的基礎技術思路轉變。
不同于 MiniMax 將架構思考滲透到不同模態的產品中,Anthropic 對多模態沒有執念,它的“瑞士軍刀”是每一代 Claude 模型的 Haiku、Sonnet 和 Opus 三個不同性能的版本,相當每一代瑞士軍刀的三件套。
這些東西,對普通用戶而言可能無感,但對 AI 研究人員來說就有意思得多,當然最興奮的是那些開發者——尤其是企業級的開發者,他們很容易找到想要的東西,比如工具和 API。
在接受訪談時,閆俊杰說:“技術驅動和產品驅動,這兩個東西有可能都是對的,但沒法共存。它的驅動力只能有一個。后面我們開始意識到,有可能那樣一條路(產品驅動)也是對的,但它不是適合我們的。我們能做的,就只能是技術驅動的方式。”
潛臺詞是:他們糾結過,最終選擇了技術驅動,知道會失去一些東西(比如快速的用戶增長),但這是他們唯一能做好的路。
這么做的結果是什么呢?真的是得忍受漫長的在消費級市場的默默無聞,等著5年后、甚至10年后的“效果涌現”么?
我們看看它們商業化的數據。
2024年,Anthropic 收入只有10億美元;2025年僅3-5月,它的營收規模就從20億美元增長到30億美元,Meritech分析師 Alex Clayton 表示:“我們研究了200多家上市軟件公司的 IPO,這種增長速度從未發生過”。
2025年上半年,Anthropic 的研發投入與營收比大致為1.04:1,基本已經打平,這在尚處于軍備競賽階段的 AI 產業已經相當令人羨慕了。它明顯比 OpenAI 對應的1.56:1健康得多。
受限于資本投入、算力和市場規模,MiniMax 自然無法與 Anthropic 完整相提并論,但《The Information》報道,MiniMax 是目前亞洲大模型公司中,唯一被證實擁有規模化全球收入的玩家——這些收入都來自可持續、可規模化的產品(C端的海螺視頻、Talkie,B 端的 API 訂閱),而非靠資本輸血或薄利的項目制維生。
MiniMax 的收入規模在它公布的招股說明書中,有著經過審計的更加嚴格的口徑:
MiniMax從2023年開始進行商業化,營收已達到346萬美元,2024年直接飆升到3052萬美元,同比增長782.2% 。2025年前9個月,公司的營收額較上年同期增長175%,達到5344萬美元,已經遠遠超越了去年全年的水平。截至2025年9月30日,MiniMax 在 C 端收入同比增長了181%,B 端收入同比增長了160%。
毫無疑問,它呈現了一條具有想象力的營收曲線。
而最體現大模型實際調用量的 OpenRouter 的數據顯示,MiniMax M2 是 OpenRouter 上第一個日 token 消耗量超過500億的中國模型,免費版加付費版模型的 token 日調用量已超過800 億,躋身Top 10(分列第4和第7),用量都在高速增長。
這意味著,向 Anthropic 一樣靠賣 API 掙錢,接收來自企業信用卡的收入;以及通過 Stripe 支付系統收取來自個人用戶的收入,而不是承接企業或政府和事業單位的大型部署項目,開具一兩年后才可兌換的一張張企業支票,在 MiniMax 正在變成現實。
此次招股書里也透露了相關的關鍵數據, MiniMax的B端業務的毛利率已經達到69.4%,顯著高于同行。而整體的毛利也從2023年的-24.7%快速轉正,2024年為12.2%,2025年前九個月更是到了23.3%。
2014年,Anthropic CEO Dario Amodei 還在百度實習時,他說那時就發現了 Scaling Law(縮放定律)——大語言模型最核心的原理。當時還在中科院自動化所讀博士學位的閆俊杰也在百度實習,做深度學習實驗。
閆俊杰回憶:“那個時候國內沒有萬卡,但那是國內唯一的一個真正意義上的 GPU 集群。我當時用了可能三分之一的 GPU 做實驗。我開始意識到,AI這件事真的可以帶來實際價值,而不只是寫論文”。
然而,中國畢竟錯失了 GPT-3.5 的時間窗口,而 Scaling Law 其實是2014年在中國發現的。亡羊補牢,有的時候確實挺晚的。接下來,是跳躍式的發展,還是遵循內心和“第一性”,不同的人有不同的答案。
有意思的是,Anthropic 和 MiniMax,這兩個看上去最不像的,甚至在地緣意義上處于某種微妙對立的公司,選擇了非常接近的答案。
點個“愛心”,再走 吧





京公網安備 11011402013531號