新智元報道
編輯:KingHZ
AI時代的基建狂潮來了!Anthropic聯合創始人Tom Brown直言:人類正踏上一場規模超越阿波羅登月、曼哈頓計劃的算力競賽。他,曾經線代只考70多,6月自學成才,加入OpenAI打造GPT-3,創立Anthropic……一路開掛堪比韋小寶,他正是AI時代最燃的注腳!
AI算力競賽,比阿波羅更龐大,比曼哈頓更瘋狂!
Anthropic聯合創始人Tom Brown直言,AI基礎設施的規模超越阿波羅與曼哈頓計劃。
AGI算力投入正瘋狂膨脹,每年增速高達3倍。
明年,這個增長勢頭確定無疑;但到了2027到2028年,不確定性稍高。
Tom Brown,或許并不如奧特曼、馬斯克那樣家喻戶曉,但在AI圈,他是被低估的傳奇。
特別的是,他自學成才——從線性代數只考了B-的學生,硬是成長為推動通用人工智能突破的核心人物。
在OpenAI協助打造了GPT-3之后,他和OpenAI志同道合的同事,另立山頭,共同創立了Anthropic。
當剛起步時,他們完全看不出會成功:
OpenAI擁有十億美元的資金,還有一群明星科學家;
而Anthropic只有七個聯合創始人(見下圖),硬著頭皮起步,連能否做出產品、產品會是什么樣都沒譜。
如今,Anthropic的Claude,已經成為全球開發者的首選。
在Anthropic,他主導著他稱之為「人類史上最大規模的基礎設施建設」——一場比阿波羅登月、曼哈頓計劃更龐大的算力競賽。
在硅谷的「黃埔軍校」YC的Lightcone Podcast「光錐播客」節目中,Tom Brown首次全面講述了自己的非典型人生歷程。他還分享了對年輕工程師的肺腑之言。
這場訪談完整回顧了Tom Brown的創業與研究歷程:
畢業即創業,體會「狼性」文化;
在Grouper遭遇失敗,轉向AI自學;
厚臉皮聯系Greg Brockman,進入OpenAI;
參與GPT-3訓練基礎設施,見證scaling law的力量;
與OpenAI團隊決裂,創立Anthropic;
推出Claude,并在Claude 3.5/3.7迎來市場轉折;
打磨Claude Code,意外成為爆款應用;
負責超大規模的算力與硬件基礎設施;
最后強調:年輕人要勇敢冒險,追隨內心使命,而不是追名逐利(chasing credentials)。
MIT學霸創業踩坑錄
主持人問:21歲從MIT畢業,Tom進入科技行業,從2009年到今天,怎么一路走到聯合創辦Anthropic這樣重要的公司?
他追憶了他的來時路。
21歲從MIT的計算機專業畢業后,放棄巨頭offer,他加入朋友初創公司linked Language,首次體驗「狼性」創業文化。
畢業即創業,他直言這段經歷改變了他的心態:
在學校里,別人給我布置任務,我就完成任務,就像一只等著被喂食的狗。
但在創業公司,我們更像狼——必須自己去獵食,不然孩子會餓死。
這種轉變給了他勇氣直面更大更難的事。
之后,Tom去了移動廣告平臺Mopub,是第一號工程師。雖然想當「狼」,但那時編程水平其實很差,他常常覺得自己跟不上。但這段經歷讓他學到了如何把東西拓展。
之后,他卻連續踩坑:
第一次當CEO:做「比Heroku更靈活」的DevOps平臺,結果連自己都說不清要做什么。
第二次做約會App:YC之父Paul Graham把他介紹給Grouper,被Tinder直接降維打擊,邊燒光錢邊靠「每周帶團隊去相親」續命。
對Tom來說,Grouper的吸引力在于:本來,他非常笨拙、害羞,特別希望有個平臺能讓他在朋友陪伴下去認識女生,這樣會更安全。
唯一比他還常去Grouper約會的人是Greg Brockman。他一度幾乎每周都在社交軟件上發「這周誰去Grouper?」。
Greg Brockman:OpenAI聯創、現任OpenAI主席
他們也成了好朋友,這也成為他之后進入OpenAI的重要人脈。
在Grouper,他被搞得身心俱疲:創業的高潮讓人興奮,但低谷也極度痛苦。
回頭看,Tinder的方案比他們好得多,Grouper的使命被超越了。
業務下滑、收入減少,但Tom仍在招工程師,不斷推銷一個連自己都不再相信的夢想——那種感覺簡直像「死亡行軍」。
所以那段時間,他并沒有立刻投入研究,而是先「晃蕩」了一陣子。
比如,去做瑜伽、CrossFit,甚至花三個月造了一輛「藝術車」開去Burning Man藝術節,洗去一身「班味」。
六月自學AI
「走后門」加入OpenAI
他猶豫了很久是否要轉型去做AI研究:
也許,我們這輩人就會遇到顛覆性人工智能(Transformative AI)的出現,如果真發生,那是人類最重大的事件。
或許我能幫上點忙。但我大學線性代數才考了B-(差點是C+),這種水平能行嗎?
2015年,Tom離開了Grouper,但一直到一年后才加入了OpenAI。
那時,想要搞AI研究,大家覺得你必須是頂尖學霸才有資格。所以,他不確定能否勝任,加上之前創業有所成就,他一度想干脆再去做個新創業項目算了。
他的朋友們聽說他要去做AI研究,都覺得很怪,甚至有點糟糕。他們說:「AI安全?聽起來就像火星人口過剩一樣荒謬!」
他們都懷疑Tom不一定適合干這事。所以他足足猶豫了半年,才慢慢鼓起勇氣去嘗試。
玩了三個月后,他逼自己進入「隱身學習模式」六個月,好讓自己有機會進到頂尖實驗室。
當時只有三個選擇:DeepMind、谷歌Brain、MIRI(機器智能研究院)。但他完全沒技術積累,只能靠自學。
那是2015年,深度學習剛火起來,他的主要計劃是:
在Coursera上自學機器學習課程;
做一些Kaggle項目;
讀《Linear Algebra Done Right》;
翻一本統計學教材;
甚至用YC校友點數買了一塊GPU,SSH遠程上去跑實驗。
為了進入OpenAI,他一開始就厚著臉皮去找Greg Brockman,畢竟那時OpenAI團隊里大多是研究員,陣容強大。
OpenAI宣布成立的當天,Tom就給Brockman發消息:「我線性代數才B-,但會一點工程,懂一些分布式系統。要是能幫上忙,哪怕掃地拖地我都愿意。」
Greg覺得懂機器學習又懂分布式系統的人太少了,Tom是個鬼才。
于是把Tom介紹給Pieter Abbeel,幫他整理學習計劃。
Pieter Abbeel是加州大學伯克利分校的教授,專攻機器人學習領域。2016年4月26日,他從伯克利休假,全職加入了OpenAI
后來,Tom每個月都去跟進學習,終于等到一個機會:OpenAI想做游戲環境,需要人幫忙搭建星際爭霸(StarCraft)環境。于是他加入項目。
當時,OpenAI落腳在舊金山的Dandelion 巧克力工廠樓上,還有馬斯克承諾的十億美元資金,創業氛圍十足。
之后的一個關鍵節點是:他開始負責訓練GPT模型的工程系統。
GPT-2還在TPU上訓練,而GPT-3的重大突破是切換到GPU并使用更多算力。
在OpenAI干了一年,他中間離開去Google Brain待了一年,后來又回到OpenAI。
他恰好碰上GPT-3的訓練期(2018–2019)。
那時大家已經意識到Scaling Law的力量:只要用對方法,算力越多,智能就越強。
Dario Amodei發表了著名的Scaling Law論文,證明了這一趨勢。
Danny Hernandez的研究顯示,算法效率提升也在持續降低成本。
這兩股力量疊加,讓OpenAI看清未來幾年智能水平會爆炸式提升。
當時他最震撼的是:那條直線跨越了12個數量級——從小模型到超級大模型,全都穩定對齊在同一條線。
這么長的數量級跨度,在其他科學領域都沒見過。于是Tom完全轉向做scaling相關工作。
當然,當時學界很多人還在批評OpenAI,說「你們只是在堆GPU,太粗暴,沒技術含量」。有人甚至形容這就是「愚蠢但有效」的辦法。
如今看來,正是這條「笨辦法」推動了智能的飛躍。
分道揚鑣,自立門戶
Tom待過OpenAI、谷歌DeepMind和Anthropic,可謂美國AI界的「三朝元老」。
Tom原本是從GPT-3團隊的一員,到底為何與OpenAI決裂?
這與與Amodei兄妹難脫關系。
當時,OpenAI負責safety和scaling的團隊向Daniela、Dario Amodei兄妹報告。
兩支團隊合作默契,而且都堅信:
Scaling Law必然會帶來顛覆,最終人類將不得不把某種控制權移交給通用人工智能(AGI)。如果運氣好,它會與人類目標保持一致,帶來順利的過渡;如果運氣不好,后果可能極為嚴重。
因此我們必須建立一個能夠承擔這種重任的機構。
這就是他們自立門戶核心原因。
Tom坦承當時并不確定這是對世界最好的選擇。回頭看,結果證明這是明智的。
早期加入Anthropic的人都是抱著「使命」來的。他們本可以去更體面、更賺錢的地方,但選擇了Anthropic,因為他們相信這件事值得做。
這也成為公司文化的基石:前100名員工幾乎都是因使命而來。
Anthropic的linkedin主頁介紹
正因如此,直到今天Anthropic已有2000多人,政治斗爭依舊沒能滲入。如果有人覺得某個行為偏離使命,他們會直接站出來指出來。
Claude拿下開發者,ChatGPT干瞪眼
大概在ChatGPT推出前9個月,Anthropic推出了第一個產品Slack機器人Claude 1。
初期,Anthropic還猶豫是否發布產品,專注于研究和基礎設施。ChatGPT的發布是一個催化劑,促使Anthropic推出API和Claude AI。
Claude 3.5 Sonnet特別是Claude Code是其關鍵轉折點,獲得了巨大的市場認可。
2023年,幾乎所有創業者都在用OpenAI。
但到2024年,Claude 3.5尤其是Sonnet版本開始迅速搶占市場份額。
尤其在編程場景里,從個位數一路升到20%、30%,甚至現在可能80%、90%的創始人更偏好Claude。
國外某投行LLM報告:https://menlovc.com/perspective/2025-mid-year-llm-market-update/
就像OpenAI當初沒準備好ChatGPT的爆紅一樣,Claude 3.7 Sonnet同樣讓Anthropic驚訝——它意外解鎖了「智能體式編程」的能力。
每一次迭代,Claude的新能力驚艷眾人。
Claude Code的誕生
「心智切換」理論
YC的創業者調研顯示,大家在編程上更喜歡用Anthropic的模型,這種偏好遠超基準測試結果能解釋的范圍。為什么會這樣?是有意為之,還是自然涌現?
Tom覺得主要原因是——不「刷榜」。
其他大實驗室都有專門團隊,盯著基準測試題庫做針對性優化,目標就是讓分數更好看。但我們沒有這樣的團隊,所以反而避免了訓練集和測試集的過擬合。
Anthropic內部當然也有自己的評測指標,但不會對外公布。團隊主要盯著內部benchmark去優化,同時大量「dogfooding」(內部自用)——比如讓Claude來加速自己的工程師工作,這是最高優先級。
最近,Claude Code特別成功。主持人問起了它的起源,沒想到Claude Code最初只是個無心之作。
工程師Boris Cherny為了幫團隊寫代碼,臨時拼湊出來的內部小工具。
一開始,Anthropic的戰略是:只做API,不碰應用。因為他們覺得,外部創業公司有無數點子,肯定更懂產品。所以他們全力把API打磨到最好,讓開發者去構建應用。
結果Claude Code出乎意料地跑了出來,作為一個產品,它居然比市面上的替代品更好用。
對此,Tom有個「心智切換」理論——把Claude本身當成「用戶」來對待。
在linked Language,用戶是老師;
在Grouper,用戶是紐約的單身青年;
在Claude Code,用戶既是開發者,也是Claude自身。
所以團隊的思路是:給Claude配備最合適的工具和上下文,讓它更高效地幫助人類完成任務。
這是一種「以模型為中心」的思維方式,對Anthropic而言卻格外自然。
人生忠告
如果今天有一個「年輕版的你」——20多歲,正想進入AI領域,想搭上這班快車,你會給他什么建議?
Tom會說——要敢于冒更多風險。
選擇那些即使失敗,朋友們也會覺得你很酷、很欽佩的項目。或者,你理想中的那個更好的自己,會為之驕傲的事情。去做這樣的事,而不是一味追逐所謂的「安全路徑」。
主持人最后問了大學生常見的困惑:到底要不要繼續上學?未來還有沒有工作?世界會怎么變?
Tom的建議是:
不要太在意外部的標簽(比如學位、證書、去大廠)。
內在驅動比外在驅動更重要。
如果只是為了拿一個文憑,或者去FAANG公司(Facebook、Apple、Amazon、Netflix、Google)混一份工作,那已經沒什么意義了。
現在的世界變化太快,靠「傳統路徑」已經不再是優勢。真正的價值,是你能不能在朋友心中、在自己心里,都覺得「我做了一件了不起的事情」。
參考資料:
https://x.com/slow_developer/status/1957925542663184817
https://x.com/ycombinator/status/1957815586744070653
https://www.youtube.com/watch?v=JdT78t1Offo
https://www.linkedin.com/in/nottombrown/





京公網安備 11011402013531號