![]()
本文來自微信公眾號:劃重點KeyPoints,作者:林易,原文標題:《YC 2025年度AI報告:Gemini崛起、Vibe Coding成熟,你需要更新的15個認知》,題圖來自:視覺中國
近日,全球頂級創業孵化器Y Combinator在最新一期視頻播客中,對2025年AI行業做出年終總結。作為全球初創企業的風向標,YC每年孵化大量頂尖AI初創公司,其內部觀察往往預示技術與商業的轉向。在本次對談中,四位合伙人針對2025年的模型競爭格局、AI基礎設施泡沫,以及創業與人才趨勢等核心議題,展開了深度討論。
一、關于模型競爭格局
1.Anthropic份額反超OpenAI:
Anthropic的模型份額突破52%,正式超越長期霸主OpenAI。2024年到2025年初,Anthropic的份額大多維持在25%左右,在過去3到6個月中實現了“曲棍球棒”式的陡峭增長。這種轉變的核心驅動力在于Anthropic優秀的編寫代碼能力,這讓它成為許多開發人員的首選工具,并滲透到其他使用場景。
2.Gemini大爆發:
Gemini的市場份額在一年內從個位數暴增至23%,其推理能力在2.5 Pro發布前就已經表現優異。在信息獲取的準確性上,Gemini優于Perplexity,雖然速度稍慢,但在處理需要高可靠性的實時資訊時更值得信任,這使其成為了許多人的常用模型。
3.記憶成為OpenAI的消費端護城河:
ChatGPT了解用戶的個性、思考方式和歷史背景,這種深度定制的體驗形成了極高的遷移成本。雖然Perplexity擅長快速網頁研究,但在理解用戶意圖的深度上,ChatGPT的記憶功能正在成為一種面向消費端的競爭壁壘,使老用戶很難徹底切換到其他沒有個性化積淀的模型 。
4.編排層成為標配:
現在的AI創業公司已不再押注于單一模型,而是通過構建編排層來實現技術的抽象化。這意味著創始人可以根據具體任務靈活調用最擅長的模型。
例如,先用Gemini 3進行上下文工程處理,再將結果輸入OpenAI執行,并根據新模型的發布動態進行替換。這種做法的底氣來自于初創公司深耕某一垂直領域,擁有的專有評估標準(Evvals)和垂直領域的特有數據集,使模型成為可替換的商品化組件。
5.深度消費體驗的缺位:
盡管模型能力強大,但目前市場上仍缺乏能全自動處理復雜高價值交易的深度消費類應用。這導致用戶和初創公司開始出現手動套利行為:同時打開多個模型標簽頁,給它們相同的任務并對比輸出,甚至讓不同模型互相審計。在全自動化應用成熟之前,用戶必須通過大量提示工程和跨模型驗證才能確保準確性。
二、關于AI基礎設施泡沫
6.基礎設施過剩是創業者的紅利:
計算資源的過剩反而預示著機會。YC回顧了九十年代末的電信泡沫:當時數百億美元堆出的過剩帶寬,最終孕育了YouTube等偉大的產品。在AI智能時代,英偉達、谷歌、AMD之間的激烈競爭意味著計算資源會變得越來越廉價且充沛。對初創公司而言,這不僅降低了成本,更提供了一個可以自由施展創意的溫床。
7.從安裝轉向部署:
經濟學家卡洛塔·佩雷斯的理論指出,技術革命分為安裝和部署兩個階段。2023年瘋狂購買GPU和建造數據中心的行為屬于重資產的安裝階段,而現在正處于向部署階段的過渡期。這對初創公司是極大利好,因為他們不需要參與耗錢的基建競爭,而是在既有的AI基礎設施上構建下一代應用,未來的Facebook或谷歌往往誕生在這個階段。
8.能源瓶頸與太空數據中心:
發電能力是AI發展的重要限制因素。由于陸地上的土地和電力建設速度跟不上需求,原本看似荒謬的太空數據中心方案已成為谷歌和馬斯克等巨頭跟進的方向。YC內部公司Zephyr Fusion正在研究如何通過太空聚變反應堆實現吉瓦級的能源供應,在物理模型上,這可能是未來十年解決計算能源短缺的唯一合理途徑。
9.AI經濟體系趨于穩定:
相比2024年底的動蕩和迷茫,2025年的AI經濟已經進入了一個相對穩定的體系。模型層、應用層和基礎設施層的分工變得非常明確,各方都有獲利空間。如何基于大模型構建一家AI原生公司已經擁有一套成熟的操作手冊,不再是摸著石頭過河,這種確定性為行業的可持續增長奠定了基礎。
10.擴展定律(Scaling Laws)與人類抗拒心的緩沖:
盡管技術在飛速起飛,但根據擴展定律,技術增長是對數線性的,會逐漸遇到上限。更重要的是,人類天生具有抗拒改變的傾向,兩者共同構成了緩沖墊,讓社會、文化和政府有足夠的時間來消化AI技術。
三、關于創業與人才趨勢
11.Vibe Coding走向成熟:
Vibe Coding在2025年正式從一種創始人的行為模式演變成了一個成熟的行業類別。這種開發方式讓開發者關注高層邏輯和“感覺”,通過大模型快速生成代碼并迭代原型。雖然目前它還無法交付100%穩定的生產代碼,但它極大地提升了驗證想法的速度,徹底改變了創業公司早期的工作流程。
12.垂直模型擊敗通用模型:
構建模型的知識正在普及化,不再是極少數天才的專利。許多初創公司利用開源模型,結合垂直領域的專有數據集進行強化學習(RL)微調。數據證明,這些針對特定垂直行業的小模型(例如只有8B參數)在專業基準測試中完全可以擊敗OpenAI的通用大模型,“專有數據+后訓練基礎設施”才是初創公司的硬實力。
13.反炫耀趨勢:
AI時代催生了一種新型的成功標準:不再炫耀籌了多少錢或雇了多少人,而是炫耀團隊的精簡與收入的高效。Gamma僅憑50名員工就實現了1億美元的年經常性收入(ARR)。雖然“一個人的萬億美元公司”尚未出現,但小規模團隊創造巨額收入的故事正在成為AI原生公司的新常態,高生產力已經取代了規模擴張。
14.人才組合的普及:
十年前,頂尖的研究思維、強大的工程能力以及敏銳的商業頭腦人才組合極其罕見,但到了2025年,這類人才已經大量涌現。相關的構建知識分散化,當稀缺技能變成通用技能時,行業爆發就隨之而來。未來將有更多應用型AI公司崛起。
15.效率提升與客戶期望的博弈:
盡管AI極大地提高了個人效率,但領先的AI初創公司依然在像以前一樣積極招聘。因為AI在降低生產成本的同時,也拉高了客戶對產品功能的期望,公司必須招募更多的高端執行人才來滿足不斷增長的市場需求和更快的交付周期。現在的瓶頸不在于創意,而在于招募到出色利用AI技術進行高質量執行的人手,人才競爭依然激烈。
以下為YC播客對談實錄:
1.模型王座更替:Anthropic與Gemini的崛起
Garry:歡迎回到新一期的《The Light Cone》。今天我們要聊聊在2025年看到的那些最令人驚訝的現象。Diana,你發現了一個非常瘋狂的例子,這幾乎可以看作是AI領域“旗手”的更替:在這一期YC孵化器中,創業者對大語言模型(LLM)的偏好發生了巨大變化。
Diana:是的。我們剛剛結束了2026年冬季批次的創業公司甄選。在申請過程中,我們會詢問所有創始人的技術棧以及他們首選的模型是什么。
結果令人震驚。在過去很長一段時間里,OpenAI在YC歷屆批次中都是毫無爭議的贏家。我記得我們剛開始做這個播客系列時,OpenAI的市場占有率在90%以上,雖然這個比例一直在下降。但在這個批次中,排名第一的竟然變成了Anthropic,它的份額略微超過了OpenAI。誰能想到呢?
Garry:Anthropic在2024年到2025年初的大部分時間里,份額一直維持在25%左右。但在過去的3到6個月里,局勢發生了逆轉。
Diana:Anthropic的增長曲線像“曲棍球棒”一樣陡峭上升,最終突破了52%。
Garry:你認為原因是什么?
Diana:我認為主要在于模型選擇的邏輯。正如我們今年所見,很多基于“Vibe Coding”工具和編寫代碼代理(AI Agents)的項目取得了成功,這已經成為一個能創造巨大價值的領域。而事實證明,在這一領域表現最出色的模型正是來自Anthropic的模型。
這并非偶然。從我們之前與Tom Brown(Anthropic聯合創始人)的對話中可以聽出來,編寫代碼能力是他們的內部評估指標之一,他們有意識地將其作為北極星指標,這種偏好也直接體現在了模型的輸出質量上。因此,對于許多正在構建產品的創業者來說,Anthropic成了他們的首選。
Jared:其實很多人在非編程場景下也會使用它,我覺得這其中存在一種滲透效應。當人們在個人編程中習慣了Claude的個性化之后,在處理其他任務時也會傾向于選擇它。即便他們的應用程序根本不涉及任何代碼開發,他們也更愿意選擇自己熟悉的模型,比如Claude Opus或Sonnet。
Garry:那Gemini的表現如何?它在排名中處在什么位置?
Diana:Gemini的增長也相當快。去年它的份額可能只有個位數(約2%到3%),但今年冬季批次已經上升到了23%左右。我們團隊內部也大量使用了Gemini 3.0,它的質量和效率確實令人印象深刻。
這些模型似乎都有各自的性格。OpenAI給人一種冷酷的“黑貓”氣質;而Anthropic則像是一只隨遇而安、輕松愉快且非常樂于助人的“金毛尋回犬”。這是我與它們交流時的直觀感受。
Harj:沒錯,我今年已經把Gemini作為我的常用模型了。甚至在2.5 Pro發布之前,我就覺得它的推理能力表現更好。現在我越來越多地用Gemini代替Google搜索。我很信任Google的Grounding API,它能利用Google的搜索索引提供實時且準確的信息。
在信息獲取的準確性上,我認為它比目前市面上所有的工具都要好,甚至優于Perplexity。雖然Perplexity的速度更快,但并不總是準確;Gemini雖然稍慢,但如果你問它今天發生的事情,它的回答往往非常可靠。
Garry:你們都換了工具,但我還沒從ChatGPT換走。我覺得它的“記憶”功能非常有黏性,它了解我的個性,也知道我思考問題的方式。
我會用Perplexity去做一些快速的網絡研究任務,因為我覺得ChatGPT在網頁搜索方面還是有些滯后。我認為“記憶”正在成為面向消費端體驗的一道護城河。我并不指望Gemini能擁有像ChatGPT那樣的個性,感覺它們是完全不同的實體。
Harj:讓我驚訝的是,市場上還沒有出現更多的深度消費類應用。回想起來,我今年最大的變化就是提示工程(prompt Engineering)和上下文工程的工作量急劇增加。比如我最近買了一棟房子,整個過程我都在和ChatGPT深度溝通。我把每一份房屋檢查報告、所有的PDF文檔都塞給它,讓它幫我總結重點,從而在與經紀人的博弈中建立信息對等。
Garry:雖然你可以把PDF丟進模型讓它總結,但這種高價值交易中,如果你不進行大量的提示和引導,很難完全信任模型的準確性。你還是需要付出努力去核實。
Harj:確實,我還沒看到哪個應用能全自動地完成這些工作。
2.行業新常態:多模型編排
Garry:你們看到Karpathy發布的那個“LLM競技場”了嗎?我現在其實是在用一種更原始的方式在做這件事:我同時打開Claude、Gemini和ChatGPT的標簽頁,給它們相同的任務,然后對比輸出。我通常會把其他模型的建議丟給Claude,讓它們互相審計。
Diana:這種在消費端出現的、類似于“手動套利”的行為非常有意思,初創公司其實也在做同樣的事情。我接觸過不少創始人,他們以前可能是OpenAI的死忠粉,但現在都在嘗試跨模型的策略。
我最近剛和一些AI公司的創始人聊過,這些公司大多已經發展到了B輪階段,規模不小。他們現在都在做一件很有意思的事:通過構建一個“編排層”來實現技術的抽象化。這意味著當新模型發布時,他們可以靈活地進行替換,甚至根據特定任務的需求,調用最擅長的模型。比如我聽一家初創公司說,他們會先用Gemini 3進行上下文工程處理,然后將結果輸入到OpenAI的模型中去執行。隨著新模型不斷涌現,他們也在持續迭代各個類別中表現最強的AI代理。
這種做法之所以可行,是因為他們擁有專有的評估標準和數據集。作為垂直領域的AI Agent公司,他們在受到高度監管的行業深耕,掌握了最適合該場景的數據。我覺得這已經成了行業的新常態。雖然模型公司投入了巨額資金讓底層智能變得更快、更強,大家都能從中受益,但應用層公司也會盡其所能地利用這些成果。這就像當年的英特爾和AMD時代,新架構不斷推陳出新,而用戶可以自由選擇和更換。
Harj:的確如此。在高層討論中,大家最焦慮的往往是價值最終會流向哪里。是流向模型層,還是應用層?這種風向似乎每隔一段時間就會發生變化。
有時候模型公司發布了非常驚艷的產品,比如Claude Code,大家會覺得模型公司要在應用層通吃了。但至少從過去幾個月的體感來看,比如Gemini的爆發式增長,又讓我們回到了那個模型互為“商品化”的世界。如果這種趨勢持續下去,初創公司在應用層將迎來又一個黃金年。
![]()
3.泡沫下的紅利:基建狂熱與能源瓶頸
Diana:我很想聽聽Jared的看法,畢竟推特上關于“AI泡沫”的負面討論最近很多。
Jared:是的,這也是本科生經常問我的問題。他們看到英偉達和OpenAI之間動輒百億、千億美元的投入,會擔心這一切是不是泡沫,或者說是不是某種虛假繁榮。
Garry:其實這種現象非常棒。我們可以回顧一下當年的電信泡沫。九十年代末,數百億甚至數千億美元堆在電信基礎設施里,造成了嚴重的帶寬過剩。但正因為有了這些廉價且充沛的帶寬,YouTube這樣的產品才得以誕生。如果沒有當初的過剩,YouTube可能要晚很多年才會出現。我們正處于智能時代,計算資源就像會思考、會做工的巖石,只要給它們充能,它們就會變得越來越聰明。對現在的大學生來說,基礎設施的“過剩”反而是機會。如果資源匱乏,競爭會變小,但價格會更高,底層利潤也會更厚。
看看今年的新聞,雖然英偉達的股價有所波動,但我長期依然看好。現在的局面是,大家不再只押注英偉達,AMD、谷歌的TPU都在發力。競爭意味著計算資源會更多,而不是更少。這對大型AI實驗室來說可能有壓力,因為他們要互相競爭,但對于在應用層創業的大學生來說,這絕對是重大利好。
Harj:確實。關于泡沫的問題,如果你是像康卡斯特(Comcast)那樣的大公司,或者你是英偉達,你確實需要擔心人們是否在過度建設GPU容量。但大學生不是基建商,他們更像是當年的YouTube。即使英偉達明年股價下跌,也不代表現在不是AI創業的好時機。
Jared:這就像扎克伯格在一次播客中提到的,meta等大公司不得不投入巨額資本開支在基礎設施上,因為他們不能袖手旁觀。如果需求波動,損失的是大公司的資本開支,而不是初創公司的。基礎設施的完善只會為構建新創意提供溫床。
Diana:經濟學家卡洛塔·佩雷斯(Carlota Perez)在書中研究過多次技術革命,她將技術趨勢分為兩個階段:安裝階段和部署階段。安裝階段伴隨著沉重的資本開支和瘋狂的基建,看起來確實像泡沫。就像2023年的聊天模型熱潮,每個人都異常興奮并瘋狂購買GPU、建造吉瓦級數據中心。
我們現在正處于從“安裝”到“部署”的過渡期。這對初創公司創始人是極好的消息,因為他們不需要參與耗錢的數據中心建設,而是在部署階段構建下一代普適的應用。在2000年之前的互聯網時代,電信巨頭的重資產投入導致了產能過剩,甚至出現了大量未使用的光纖暗線。但這沒關系,互聯網最終還是成為了巨大的經濟推動力。這意味著,未來的Facebook或谷歌可能還沒出現,因為它們往往誕生在技術革命的部署階段。
Garry:說到基建,現在的情況甚至有些夸張。我們現在面臨的限制不是技術,而是發電能力。有一家叫Starcloud的公司,最早提出在太空建立數據中心,當時被全網嘲笑。但十八個月后,谷歌和埃隆·馬斯克竟然也開始跟進這個方向了。
這種轉變的原因很簡單:我們在陸地上的發電和建設能力已經跟不上了,我們根本沒有足夠的土地和電力來支撐未來的需求。在這種環境下,把數據中心放到太空去,反而成了一種合理的解壓方式。
Jared:仔細一想,YC已經有幾家公司在解決這些問題了。比如Boom和Helion在解決能源不足的問題,還有一家叫Zephyr Fusion的公司,他們是由國家實驗室的資深工程師創辦的。這些專家研究了物理模型后發現,如果把聚變反應堆放到太空中,其實是劃算的。這可能是未來十年內實現吉瓦級太空能源的唯一途徑。
4.創業范式轉移:垂直模型與人才平民化
Harj:另外我發現,今年創辦模型公司的興趣也在增加。雖然只有極少數公司能直接挑戰OpenAI,但在YC內部,越來越多的人開始構建更小規模的模型。這些項目通常針對邊緣計算設備,或者是特定語種的語音模型。這讓我想起了YC早期,初創公司的構建知識開始分散化和普及化。當一種稀缺技能變成通用技能時,爆發就會發生。十年前,創辦OpenAI需要極其罕見的人才組合:頂尖的研究思維、強大的工程能力以及敏銳的商業頭腦。
Garry:你描述的簡直就是Ilya、Greg和Sam的組合。
Harj:這種團隊確實極其罕見。但十年后的今天,具備研究背景、工程背景和融資經驗的人才已經大量涌現。這意味著我們將看到更多應用型AI公司的崛起,以及針對各種具體任務的垂直模型。
Diana:我也是這么認為的。強化學習(RL)的普及也在產生雪球效應。現在出現了大量的開源模型,人們可以在特定的環境和任務中對其進行微調。這意味著,你完全可以利用開源模型,通過強化學習訓練出最優秀的醫療領域模型,其表現甚至能擊敗像OpenAI那樣的通用大模型。
實際上我已經見過不少這樣的例子。有一家YC初創公司利用他們收集的最佳醫療數據集進行微調,結果在醫療健康領域的基準測試中完全超過了OpenAI,而他們使用的僅僅是一個80億參數的小模型。這就證明了,擁有垂直領域的數據和后訓練(Post-training)基礎設施,初創公司完全可以構建出極具競爭力的產品。
5.年度復盤:穩定體系與精簡效率
Garry:在過去的一年里,有什么事情真正讓你們感到印象深刻,或者說特別突出的嗎?
Diana:這很有趣。我們年初做了一期關于Vibe Coding的節目,當時獲得了很高的播放量。我記得那時我們更多是將其視為在創始人群體中觀察到的一種行為模式。但我很驚訝地看到,這竟然演變成了一個巨大的行業類別。現在有很多公司在這個領域脫穎而出,比如Replit和Emergence等等。
Harj:Varun Mohan現在已經去Google了。他發布了反重力相關的視頻,那場面非常有電影感,Varun在鍵盤前操作,謝爾蓋·布林就緊跟在他后面。我其實有點好奇他們是否真的使用了Nano Banana或類似的視頻生成工具,因為那段視頻看起來過于完美了。不過考慮到Google的預算,做出高制作價值的視頻也很正常。總之,現在大家不僅僅在談論太空數據中心,也在討論Vibe Coding。
雖然我剛才的話帶點反諷,但就目前所知,Vibe Coding確實還不夠完全可靠。你不可能在整個編碼周期中只靠“感覺”,截至2025年底,它還無法交付100%穩定的生產代碼。
Jared:關于2025年讓我感到驚訝的事,我認為是人工智能經濟趨于穩定的程度。在2024年底錄節目時,我們感覺還處在一個變革極其迅速、甚至有些動蕩的時期,沒人知道下一個巨大的沖擊何時降臨,也不知道初創公司和整體經濟會走向何方。但現在,我們已經進入了一個相對穩定的AI經濟體系:模型層、應用層和基礎設施層的公司分工明確,看起來大家都有獲利空間。如何基于模型構建一家AI原生公司,現在已經有了一套相對成熟的操作手冊。
Harj:這其實是下游的連鎖反應。雖然模型本身在今年逐步改進,但還沒有出現那種徹底顛覆一切的重大技術突破。我們之前討論過,現在找到創業切入點似乎回到了正常的難度水平。只要你能堅持幾個月,很可能會有新的重大功能發布,從而催生出一系列新的創意和構建機會。
Garry:我同意。而且讓我并不感到驚訝的是,那份所謂的《AI 2027》報告。那種悲觀的文章曾預言社會將在2027年開始崩潰,但后來他們悄悄修改了預測時間,卻保留了那個驚悚的標題。我一直對這種“技術快速起飛”的論調持懷疑態度。即使按照擴展法則(Scaling Laws),技術的增長也是對數線性的,這意味著它會逐漸遇到上限,速度比想象中慢。
這其實算是個好消息。人類本質上是不喜歡改變的。我們之前分析過麻省理工學院的一份報告,提到90%的企業AI項目都失敗了。事實是,大部分企業連基礎業務都還沒搞明白,更不用說應用AI了。這種人類組織對改變的抵觸,反而成了制約新技術過度滲透的緩沖墊。
雖然我支持推動技術快速進步,但在這種情況下,慢一點也許是好事。在對數線性擴展和人類抗拒改變的共同作用下,社會、文化和政府將有足夠的時間來消化和回應這項強大的技術,而不至于陷入瘋狂的失控狀態。
Harj:還有一件事讓我驚訝。去年這個時候,我們在討論有些初創公司在只有創始人、沒有雇人的情況下,年收入就達到了一百萬美元并籌集了A輪融資。我原以為這種模式會持續擴大,比如到了一千萬美元ARR(Annual Recurring Revenue)時依然不雇人。但實際情況是,這些公司后來還是回過頭來開始組建真正的團隊。雖然現在的公司規模可能更小,但玩法基本沒變。瓶頸依然在于招聘人才所需的時間。
Garry:雖然AI提高了效率,但因為業務增長太快,對高端執行人才的需求反而更迫切了。像Harvey和Open Evidence這樣的公司,早期拿到了風投的大額資金,把資本作為一種防御護城河。現在我們看到了第二波AI驅動的公司出現,比如Lora 和Giga,競爭依然非常激烈。有些公司在微調模型上燒掉了大量的資本,卻沒有轉化為實際的競爭優勢,獲利的只有投資者,因為他們擁有你公司更多的股份。
Harj:關于團隊規模,目前存在兩種觀點:一種認為AI會讓一切變得更高效,因此需要的人更少;另一種則認為AI降低了生產成本,但也拉高了客戶的期望,你必須招聘更多人來滿足不斷增長的市場需求。
今年看起來更傾向于第二種情況。那些領先的AI初創公司依然在像以前一樣雇人。他們受限于能夠出色執行的人手,而不是受限于創意。
Garry:我同意。由一個人經營萬億美元公司的時代還沒到來,但最終會朝那個方向發展,我認為202 年也不會發生這種情況。不過,我們會看到更多由不到一百人組成的團隊創造出數億美元收入的故事。比如Gamma,他們只有50名員工,年經常性收入(ARR)卻達到了一億美元。
這是一種非常棒的“反炫耀”趨勢。以前大家喜歡炫耀籌了多少錢、雇了多少人,現在大家開始炫耀收入有多高、而團隊規模有多精簡。好了,今天的時間就到這里,祝大家新年快樂,我們下次見。
本文來自微信公眾號:劃重點KeyPoints,作者:林易,編輯:重點君
本內容由作者授權發布,觀點僅代表作者本人,不代表虎嗅立場。如對本稿件有異議或投訴,請聯系 tougao@huxiu.com。
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4820339.html?f=wyxwapp





京公網安備 11011402013531號