
裁員、收縮、高管動蕩,企業燒不出一張“大模型船票”。
文|智能涌現
今天凌晨,亞馬遜云科技宣布在Amazon Bedrock平臺上推出全托管、無服務器的DeepSeek-R1模型,是首個提供DeepSeek-R1作為全托管、正式商用模型的海外云廠商。所以,對于出海企業而言,Deepseek on Bedrock是一個絕佳的選擇。另一方面,作為首個登陸Amazon Bedrock的國產大模型,DeepSeek自今天1月底上線以來,已有數千客戶通過Amazon Bedrock的自定義模型導入功能部署了DeepSeek-R1模型。
2025春節以來,全球最火的話題,莫過于DeepSeek。
年初,DeepSeek-R1論文橫空出世,幾乎以閃電般的速度血洗“百模大戰”。
海外“科技七姐妹”應聲巨跌,將美國三大股指砸出一個深坑;國內AI大模型玩家幾乎集體“熄火”,廣告投放收縮首當其沖,團隊裁減與高管動蕩也不在少數。
市場的反應與2022年11月底形成鮮明對比。彼時,ChatGPT同樣“橫空出世”,卻引發了全球科技產業的狂歡,海內外科技股股價狂飆,巨資涌入“百模大戰”,燒出了一片紅紅火火。
如今DeepSeek面世,不僅為強化學習的大模型路徑探索出了無數的可能性,更是毫無保留地全面開源,讓所有人都能“站在DeepSeek的肩膀上”繼續創新,這少說也能算得上是行業的“阿爾法狗”時刻(AlphaGo Zero正是靠強化學習打敗人類圍棋冠軍柯潔),怎么市場反應竟如此悲觀?
事實上,DeepSeek的火爆、市場的悲觀、以及競爭對手們的種種反應,都只是結果,而非出現這些現象的原因。
真相是,企業自研大模型,已經越來越“無利可圖”。
燒不出一張“大模型船票”
就在前不久的3月1日,DeepSeek官方披露,按照DeepSeek-R1的token定價水平,公司一日之內總收入為562027美元,成本利潤率高達545%。
一個讓絕大多數大模型玩家感到絕望的數字。
一邊是高昂的研發成本,重金聘請的博士、博士后、首席科學家;另一邊卻是低靡的日活用戶,ROI不成正比的巨額投放。越來越多企業燒不出一張“大模型船票”。
可與之相對應的,是日益慘烈的大模型競爭。
根據AppGrowing數據,截止至2024年11月,Kimi、豆包、星野、元寶等國內十款AI應用合計投放廣告數量超過625萬條,換算金額超過15億元——其中,月之暗面最為激進,其累計投放超過5.4億元。
然而,DeepSeek一夜之間將所有競爭對手打懵,根據非凡產研數據,截止至2025年2月5日,DeepSeek移動端日活用戶已突破4000萬人,當日ChatGPT移動端日活為5495萬,DeepSeek已達到ChatGPT的74.3%。
根據The Information、華爾街日報等外媒消息,OpenAI正與投資者洽談新一輪融資,其融資金額最高可達400億美元(約2900億元人民幣)。
在這個融資的當口,誰是OpenAI CEO都得急得天天發推特。

△截止至2025年2月5日ChatGPT與DeepSeek移動端DAU日活數據對比,圖片非凡產研
強敵當前,阿里、百度、騰訊等國內競爭對手紛紛向DeepSeek拋出橄欖枝,“滿血版DeepSeek”一時間成了互聯網最新流量密碼。
其中,騰訊做法最為激進,不同于競爭對手在云計算服務層面接入DeepSeek,騰訊直接將DeepSeek接進了自家AI應用“元寶”中,使其一躍成為中國區蘋果應用商店免費APP下載榜第二,甚至一度超越長期占據榜首的DeepSeek,成為第一。
在最近一次接受媒體采訪時,金沙江創投主管合伙人朱嘯虎一改往日對AGI的不信任,重新表態說:“DeepSeek快讓我相信AGI了。”
此外,他再次強調:“創業公司千萬別去做底層模型,就在上面抓住用戶,抓住場景……隨著底層模型進步,用最好的、最新的模型就行了。 ”
這一觀點聽著刺耳,略顯偏頗,但也許對于有些企業來說,并非毫無道理。
大模型競賽,已經走入下一個階段。
淘金者與賣鏟人
與大模型企業洗牌形成鮮明對比的,是全球企業AI需求的飆升,以及各大售賣AI大模型服務的云計算巨頭們拿出的亮眼業績。
根據最新一季財報數據,谷歌云2024Q4營收為119.55億美元,同比增長達30%,谷歌表示,這一增長主要得益于谷歌云平臺的核心產品、AI基礎設施和AGI(生成式人工智能)解決方案的強勁表現。
微軟智能云業務最新一季度營收255.4億美元(包括Azure),同比增長19%;Azure和其他云服務收入增長31%,其中13%的營收來自AI相關業務(Azure具體收入數據未披露)。
全球云老大亞馬遜云科技在2024Q4的收入為288億美元,連續第二個季度實現同比19%的收入增長,亞馬遜總裁兼首席執行官Andy Jassy在在分析師電話會議上表示,對亞馬遜云科技云服務將支撐全球大部分AI工作負載持樂觀態度。

△全球云巨頭市場份額占比,圖片Synergy Research Group
而且,一個更有趣的現象是,年初,當DeepSeek攪動全球市場時,亞馬遜云科技、微軟Azure、英偉達NVIDIA NIM三家海外企業于美國時間1月30日同日宣布上架或接入DeepSeek-R1模型,幾天之后,百度云、阿里云等中國云廠商才陸續宣布接入。
尤其是亞馬遜云科技,這種第一時間接入最新、最強模型的玩法,已經不是第一次了。
早在2024年3月,Claude 3系列模型“新皇出世”,在各項數據上碾壓GPT-4時,亞馬遜云科技就第一時間在Amazon Bedrock中上架了Claude 3。
同樣的故事發生在DeepSeek,也發生在meta Llama、Stability AI、Mistral AI等等模型上。根據官方數據,當前亞馬遜云科技的Amazon Bedrock平臺已經搭載了180多個基礎模型供客戶選擇,在云平臺上打起了真正的“百模大戰”。
亞馬遜云科技的這套玩法跟它一直以來在大模型領域的“Choice Matters”(選擇大于一切)戰略一脈相承。
放眼全球,雖然同為云計算巨頭,但各家玩法不同:
微軟自不必說,巨資押寶OpenAI之余,Azure OpenAI服務還獨家支持OpenAI模型。2024年,微軟與法國Mistral AI建立分銷合作并投資持股,進一步擴展歐洲市場。同時,微軟手握Office辦公室套件這一大殺器,Copilot智能助手也成為了云AI辦公場景的天然統治區。
谷歌是AI時代的老牌巨頭,大模型本輪技術創新的神級論文《Attention is All you Need》正是出自谷歌之手。谷歌云在大模型領域傾向于首推自家Gemini家族,在跨文本、圖像、音頻、視頻的多模態與聯合推理方面表現不俗。
既淘金,也賣鏟子。
而作為云計算的開創者、迄今為止云計算領域的頭部玩家,亞馬遜云科技則熱衷于擴大可供客戶選擇的前沿模型數量,比如上文提到的DeepSeek、Llama、Mistral等等。此外,亞馬遜還于2023年底、2024年年底分別向Anthropic重金投資,總投資額達到80億美元;亞馬遜云科技還于去年年底re:Invent 大會上發布了王炸級別的多模態、高性價比自研模型Amazon Nova。
事實上,亞馬遜云科技在大模型時代的戰略思路,一直更堅定地偏向“賣鏟子”。
這一戰略是市場教給他們的。
根據Jefferies & Company報告數據,當前,只有3%的企業只使用一個語言模型提供商,而34%的企業使用兩個,41%的企業使用三個,22%的企業使用四個。根據Gartner的預測數據,到2027年,80%的中國企業將會選擇多模型策略。
對于企業來說,保證其在云上多模型的選擇權,極其重要。
一方面,無論是出于安全、成本、還是復雜業務適配性的角度,云上多模型策略對于企業來說都會是最優選;
另一方面,從更深遠來說,本輪生成式AI所帶來并不僅僅是生產工具的迭代,而可能是一場觸達商業模式本質的變化。企業決策者最關心的是生成式AI所帶來的商業增長和商業價值,無論是DeepSeek、Claude,還是Nova或是Gemini,都是幫助企業實現商業價值中的一環,而非全部——亞馬遜云科技所制定的“Choice Matters”(選擇大于一切)戰略正是指向于此,只有能給企業帶來實質商業價值的生成式AI才有意義。
大模型從2022年底爆發以來,已經走過了兩年半的歷程,如果說2023年是大模型驗證之年,2024年是大模型產品之年,那么2025年,將會是大模型商業價值落地的一年。
變數
除了成本、安全、商業價值之外,企業所看重的“云上選擇權”,還有一個重要的原因:當前的大模型行業里,依舊存在大量變數。
從底層技術來說,DeepSeek-R1用天才的技術思路與巧妙工程手段復刻了GPT-o1作為推理模型的輝煌,更為強化學習的大模型路徑探索出了無數的可能性,但跳票已久的GPT-5依舊是個襁褓中的“秘密武器”。
從垂類場景來說,Diffusion架構雖然已成為文生圖領域的絕對王者,但視頻、3D,乃至其他垂直應用領域,依舊未有誰能一統江湖。更往上層的醫療、金融、零售等行業領域,則更談不上達成路徑共識。
從大模型競爭者們來說,Anthropic最新推出的Claude 3.7 Sonnet已經裝備上了混合推理能力,甚至在DeepSeek的腹地——量化投資——跨界挑戰者也層出不窮。就在不久前,量化巨頭九坤團隊成功復現DeepSeek-R1,寬德團隊則在2月24日發布了智能學習實驗室人才招聘通知,投身通用人工智能。
DeepSeek爆火,全民騷動,但大模型這場比賽,還遠未到終局。
大模型技術的下一次顛覆性突破,可能又會出現在人們意想不到的地方——可能來自DeepSeek,可能來自OpenAI,也可能來自印度、法國、俄羅斯,又或是中國深圳、重慶、上海的某個創業團隊中——近期突然爆火的Manus就是一個絕好的例證。
不過,正如上文提到的,在2025年這一大模型商業價值落地之年,對于大部分企業客戶來說,其實不太在乎手里的“黑貓白貓”來自哪家大模型企業,只要這些模型能用、好用、保持前沿,足矣。
而對于大模型的“賣鏟人”,各大云計算廠商來說,這場比賽更是剛剛開始。
互聯網從發明到成為基礎設施用了30年,云計算從技術探索到廣泛應用也用了將近20年,大模型真正成為各行各業的“新基建”,還在更遙遠的未來。

△2023年至2028年全球AI服務器市場規模保持快速增長,圖源:IDC 2025
根據亞馬遜、微軟、谷歌和meta四家科技巨頭財報電話會的最新數據,2025年,其總資本開支(CAPEX)花費預計將超過3200億美元——其中,亞馬遜云科技的資本支出預計將達到1000億美元,以抓住AI領域“千載難逢的商業機遇”。
各家技術研發層面競爭也不例外。
微軟OpenAI的GPT-4.5系列雖然飽受爭議,但業內依舊期待GPT-5的精彩表現;谷歌Gemini 2.0系列模型剛剛發布,全面實現原生多模態輸入輸出;亞馬遜云科技則在自家re:Invent大會上拿出了最新的Amazon Nova模型——全能平價多模態基礎模型,堪稱Claude 3/3.5,GPT-4o, Gemini 2.0的最高性價比“平替”,適用于企業客服、內容生成、簡單數據分析、企業內部自動化等場景。
此外,解決困擾行業已久的“幻覺”問題,各家也都想盡辦法。例如,亞馬遜云科技在Amazon Bedrock平臺推出Guardrails自動化推理檢查技術,讓系統自動通過數學驗證方式嚴密證明事實性錯誤是否會發生,避免大模型繼續“一本正經地胡說八道”。
上一輪AI技術熱潮中,人臉識別、語音識別等技術正是承著智能手機的熱潮才得以快速普及,這一輪大模型技術革命又將為行業格局帶來全新的變數。
大模型時代風起云涌,一場全新的戰役,正拉開帷幕。
參考資料:
《2025年中國人工智能計算力發展評估報告》IDC&浪潮信息《Cloud Market Growth Stays Strong in Q2 While Amazon, Google and Oracle Nudge Higher》Synergy Research Group《DeepSeek-V3/R1 推理系統概覽》DeepSeek《DeepSeek移動端日活突破2570萬!上線20天達ChatGPT五成,已是全球第二大AI應用》非凡產研100aiapps.cn《Jefferies Sticks to Its Buy Rating for Amazon (AMZN)》Market Insiderhttps://aws.amazon.com/blogs/aws/deepseek-r1-now-available-as-a-fully-managed-serverless-model-in-amazon-bedrock/https://www.aboutamazon.com/news/aws/aws-deepseek-r1-fully-managed-generally-available封面來源|視覺中國





京公網安備 11011402013531號