![]()
新智元報道
編輯:元宇
當算力成為AI時代的「新石油」,一年930億美元的資本投入仍拯救不了谷歌的「算力饑荒」,各部門為搶奪芯片爭執不下。為此,谷歌專門成立了一個協調算力分配的高管委員會。有時這個問題甚至要由谷歌CEO劈柴(Sundar Pichai)或者Alphabet董事會最終拍板解決。
谷歌算力「鬧饑荒」,連CEO「劈柴」也不得不親自下場分芯片了!
在外界眼中,谷歌是一個富可敵國、資源無限的巨無霸。
它擁有搜索、Chrome、Gmail等數款月活用戶超過20億的超級產品,每一個都是印鈔機。
此外,為了保持在AI時代的領先地位,谷歌今年計劃投入的資本支出更是達到了910億至930億美元。
即便如此,在谷歌內部,仍彌漫著一種「算力饑荒」的焦慮。
今年早些時候,谷歌的一眾核心高管被緊急召集,討論一個在部分員工眼中已經「生死攸關」的問題:
公司的芯片已經不夠分了,該怎么協調?
由于算力告急,各大產品線的負責人為爭奪有限資源陷入了激烈的拉鋸戰。
于是,一個全新的高管委員會被組建起來,決定公司有限的算力資源該如何分配:
·是優先供給谷歌云去賺取真金白銀?
·是輸送給搜索業務穩固江山?
·還是砸向谷歌DeepMind,去賭一個AI的未來?
為分芯片,大佬們「打起來了」
算力短缺在谷歌內部引發了不小的緊張氣氛,各大產品線負責人為了有限的算力爭執不下。
據一位知情人士透露,新成立高管委員會的目的就是為了簡化決策流程,在不同部門之間做到「一碗水端平」。
這些「不同部門」主要包括谷歌云、搜索等產品部門以及專注AI研究的DeepMind。
看一下這個「算力分配委員會」的名單,就能掂量出這場博弈的份量,名列其中的全都是谷歌權力版圖中的大佬:
有谷歌Cloud CEO Thomas Kurian,他手握增長引擎。
![]()
谷歌Cloud CEO Thomas Kurian
DeepMind掌門人Demis Hassabis,肩負著谷歌的AGI信仰。
![]()
DeepMind創始人、CEO Demis Hassabis
DeepMind CTO兼谷歌首席AI架構師Koray Kavukcuoglu,掌控技術底座。
![]()
DeepMind CTO兼谷歌首席AI架構師Koray Kavukcuoglu
知識與信息部門高級副總裁Nick Fox,他負責谷歌搜索、廣告、地理(包括谷歌Maps)等核心產品,守護著公司主要的現金牛業務。
![]()
知識與信息部門負責人Nick Fox
有谷歌高級副總裁James Manyika,他負責研究、技術與社會事務。
![]()
James Manyika
![]()
Alphabet CFO Anat Ashkenazi
還有掌管錢袋子的Anat Ashkenazi,她是Alphabet CFO 。
顯而易見,這是一次頂層的權力重構。
據兩位知情人士透露,這個小組在做決定時,試圖建立一套理性的評估模型。
他們會權衡:Cloud業務能帶來多少收入?谷歌的產品端能實現多少增長?
雖然這些預測往往并不準確。
但核心矛盾在于算力的需求,已經遠遠超過了供應的極限。給了一方,就意味著另一方的業務可能停擺。
因此,小組在做決定時會權衡各種因素,做出艱難的取舍。
有時,他們甚至不得不將難題上交,由CEO Pichai,甚至Alphabet董事會來最終拍板。
![]()
谷歌CEO「劈柴」(Sundar Pichai)
這背后,涉及谷歌三大核心命脈的平衡。
第一條命脈,是未來。
谷歌必須開發出最頂尖的AI模型。這些模型需要吞噬巨量的算力來持續迭代。
在如今各家實驗室新模型「你追我趕」的膠著戰況下,慢一步,就可能意味著掉隊。
第二條命脈,是增長。
谷歌Cloud是公司主要的增長引擎,它需要海量算力來服務客戶并維持擴張,這是華爾街最看重的故事之一。
第三條命脈,是生存。
谷歌必須留足算力,支撐其龐大的產品矩陣。其中有7款產品(包括搜索、Chrome和Gmail)的月活用戶都超過了20億。
依附于這些產品的廣告業務占據了公司收入的大頭,是支撐整個帝國運轉的基石。
對此,谷歌發言人在一份聲明中表示:
我們有一個嚴格且持續的流程,以確保算力資源被分配給最重要的優先事項,既要平衡當前的客戶和用戶需求,也要兼顧推動研究和創新的長期投資。
930億美金填不飽「算力饑荒」
為了填滿巨大的算力「黑洞」,谷歌像其他科技巨頭一樣,在芯片和服務器的資本支出(Capex)上開啟了「激進模式」。
Pichai在最近的財報電話會上表示,Alphabet預計今年的資本支出將在910億到930億美元之間,幾乎是2024年的兩倍。
但挑戰在于,即便砸下近千億美金,也無法立竿見影地變出算力。
建數據中心和造芯片的周期很長,谷歌當下的算力困境,實際上是在為前幾年的決策買單。
2023年,谷歌的資本支出僅為320億美元,這個投入在AI爆發的前夜顯得有些保守,正是這種滯后效應,導致了如今的被動。
算力緊張的問題在科技公司內部其實存在多年了,但隨著這兩年AI需求的爆發,矛盾愈發尖銳。
幾乎所有主流云廠商都喊著算力不夠,無法滿足客戶需求。
Alphabet的CFO Ashkenazi在10月份的財報電話會上坦承:
雖然我們一直在全力增加產能,加快服務器部署和數據中心建設……但我們預計,第四季度和2026年,供需依然會很緊張。
也就是說,這種緊日子的狀態,可能還要持續兩年。
在新的委員會成立之前,負責分配的是一個名為「機器學習戰略與分配」(MLSA)的機構。
那是一個規模龐大、包含了谷歌各個產品線領導的組織,因此往往也很難達成共識。
新小組的成立,正是為了打破這種低效的共識機制,讓權力更集中,決策更果斷。
同時,也為外界提供了一個觀察谷歌內部權力流向的窗口:究竟是哪個部門在谷歌內部的話語權最重。
Ashkenazi在今年春天的摩根士丹利會議上透露:2025年,谷歌預計會將約一半的算力分配給Cloud業務。
Cloud業務似乎暫時占據了上風。
但知情人士指出,谷歌的算力規劃是一個動態過程。
哪怕切分方案已定,隨著新產品的發布和市場的反饋,需求隨時會波動。
明年,谷歌算力分配的變量依然巨大,比如:
AI研究取得了重大突破,或者簽下了一個云服務大單,又或者是OpenAI又搞出了什么大動作,逼得谷歌再次拉響「紅色警報」。
即便芯片到手,也不意味著萬事大吉。
在谷歌復雜的供應鏈中,任何一個環節的延誤,都可能導致部署計劃的推遲,迫使谷歌再次調整計劃。
值得慶幸的是,谷歌擁有TPU(張量處理單元)這一殺手锏,這種自研芯片可以用于訓練自家的AI模型。
隨著TPU性能的提升,這意味著谷歌可以用更少的芯片跑出更好的AI模型。
但這只能在一定程度上緩解「算力饑荒」,并非終極的解決之道。
執行層的「算力生存法則」
如果說高層考慮的是整個戰略棋局,著眼的更多是長期問題。
執行層才是真實的生存戰場,他們在乎的更多是眼下的問題。
這就導致算力分配的指令到了執行層就會呈現出另一番景象:
誰能給谷歌賺最多的錢,誰就優先。
戰略優先變成了賺錢優先。
具體到了部門內部,情況又會有所不同。
以谷歌DeepMind為例,規則顯得更加復雜和微妙。
算力分配權主要掌握在Kavukcuoglu及其麾下的副總裁手中。
按規定,研究人員應專注單一項目,并據此獲得算力配額。
但在資源匱乏的現實下,「上有政策,下有對策」成了心照不宣的秘密。
知情人士稱,那些明星級的獨立貢獻者(IC),往往享有某種「特權」:
他們能同時掛名多個項目。這意味著他們手中握有多個算力池,可以靈活調配,左右逢源。
而對于普通研究員來說,當算力耗盡、項目未完時,他們必須學會一套獨特的「生存法則」。
比如,彼此之間「互借」算力——
或者是許諾「禮尚往來」:「這次你幫我,下次我資源富裕了還你」。
又或者是基于勞動的交換:「我幫你修復幾個棘手的Bug,你借我一點卡時跑個模型。」
930億美金的宏大投入,到了基層員工層面就變成了每個人對算力的精打細算。
最核心的生產資料算力,成了一種要靠人情、關系、私下交換來流通的「硬通貨」。
在當前全球性AI軍備競賽下,即使是像谷歌這樣的巨頭,有時也不得不面對「算力饑荒」的焦慮與匱乏。
參考資料:
https://www.theinformation.com/articles/inside-balancing-act-googles-compute-crunch?rc=epv9gi
秒追ASI
?點贊、轉發、在看一鍵三連?
點亮星標,鎖定新智元極速推送!





京公網安備 11011402013531號