![]()
前不久,華為發布的《智能世界2035》和《全球數智化指數2025》報告中指出,隨著大模型的發展,AI智能體將從執行工具演進為決策伙伴,驅動產業革命。到2035年,全社會的算力總量將增長10萬倍,算力增長的背后,是對新一代算力基礎設施產業發展的挑戰,但在這過程中,同樣也伴隨著不小的機遇。
AI需求暴增,數據中心建設面臨挑戰
算力需求的激增已經不僅僅是停留在預測層面,根據國家數據局披露的信息顯示,2024年初中國日均Token消耗量為1000億,到2024年底已增長至3000億量級。而這個數字到了今年6月則是達到驚人的30萬億的量級,與2024年初的1000億相比,增長300多倍。
此外,IDC報告顯示,2024年全年中國公有云大模型調用量為114萬億Tokens,而2025年上半年即飆升至536.7萬億,反映出AI應用進入規模化爆發階段?。
而AI應用的爆發,自然也帶動智能算力需求的激增,在這背后,是對底層算力基礎設施帶來的考驗,而AI也正以“算力吞噬者”的姿態重構數字基礎設施格局,全球20億活躍AI用戶產生的海量數據處理需求,使得AIDC從“輔助設施”升級為“核心生產力”。
在AI時代,傳統的數據中心建設顯然已經不能滿足當前智算對于底層設施的需求,華為發布的《智能世界2035》和《全球數智化指數2025》報告中明確,計算領域將突破傳統馮?諾依曼架構的束縛,在計算架構、材料器件、工程工藝、計算范式四大核心層面實現顛覆性創新,最終催生新型計算的全面興起。
在華為中國數字能源數據中心能源拓展部部長石憶看來,算力增長的同時,也對基礎設施造成了極大的沖擊,“當前,智算中心建設主要面臨安全、彈性、高功率、高能耗等挑戰。除此之外,作為長期運營的重資產項目,數據中心建設還需要適度超前。”
安全方面,AI大模型訓練對算力連續性的要求較傳統通算提升兩個量級:10MW智算中心的算力密度相當于100個傳統通算中心,一旦發生供電中斷,每秒鐘將造成數十萬元的算力損失。對此,石憶表示,“傳統數據中心故障響應時間要求2分鐘以內,但智算中心需壓縮至30秒,且故障影響半徑擴大3倍,任何單點故障都可能引發集群癱瘓。”
安全事件在帶來數據、服務器等直接損失之外,更可能導致數月模型訓練成果付諸東流。同時,安全事件的發生還會對IDC服務商的品牌價值,以及客戶對其信任度帶來不小的沖擊。
更嚴峻的是,傳統集中式架構存在單點故障風險,而AI計算的連續性要求,使得這種風險被放大10倍以上。AIDC的安全已不是“概率問題”,而是“底線問題”,任何一次故障都可能終結企業的AI競爭資格。
除了安全問題之外,隨著ChatGPT的問世,人們開始發現機柜的功率越來越高,原本300W的單顆CPU,已經不足以支撐業務,500W的單顆CPU芯片成為主流。與此同時,AI對于GPU的需求,也讓單機柜的功率進一步提升。2.5kW標準機柜已經是過去式,8kW、10kW,甚至20、50kW的機柜的不斷出現,也讓單機柜功率越來越高。與此同時,隨著摩爾定律逐漸失效,在后摩爾定律時代下,芯片算力與其功耗仍將大幅提升。機柜功率的不斷攀升,也對數據中心的供配電系統提出了新的挑戰。
這個挑戰一方面是來自供配電穩定性和連續性的保障;另一方面,更容易被人們所忽視的是:傳統數據中心“白空間”(服務器區)與“黑空間”(配電區)的比例大致為2:1,而在AIDC時代,這個比例將被徹底逆轉,部分高密AIDC甚至出現1:3的極端情況,這意味著3/4的場地被配電、散熱設備占據。而對于IDC客戶而言,“白空間”是用來創造價值的,“黑空間”則屬于純成本支出,獲得更多的“白空間”才能獲得更大的收益。
與此同時,在AI時代,用戶對于數據中心交付周期的要求也越來越高。而作為算力的底層支撐,數據中心的建設周期之長,是業內的共識。
而AI等IT技術的演進日新月異,數據中心機柜密度也隨之飛速提升,“傳統建設方式,規劃階段規劃的單柜功率普遍在5-10kW/標準柜,而目前單臺支持大模型的AI服務器功耗就已達10kW以上,數據中心的規劃建設速度難以滿足各行業對算力持續高速增長的迫切需求。”此外,還有一個尖銳的矛盾擺在面前:服務器的更新周期是3到5年,而數據中心基礎設施的設計壽命是10至15年。對此,石憶告訴筆者,傳統數據中心18到24個月的建設周期,與算力“一年一迭代”的速度形成致命錯配。客戶交付周期要求從‘年’,壓縮至‘月’,甚至出現‘6個月必須上線’的硬性指標,這種情況對數據中心的建設速度提出了更高的要求。
而在這些挑戰的背后,還有一個不容忽視的問題——AI時代帶來的傳統異步計算向同步計算的轉型。這個過程使得供電、制冷、網絡的協同要求達到“微秒級”,而現有基礎設施的“煙囪式”架構根本無法實現這種協同。更嚴峻的是,技術迭代帶來的標準混亂問題——不同廠商的GPU、液冷設備接口不統一,導致AIDC建設陷入“定制化陷阱”,進一步拉長周期、推高成本。
安全是AIDC的首要條件
面對挑戰,華為數字能源在2025全聯接大會上提出的RAS理念(Reliable安全可靠、Agile彈性敏捷、Sustainable綠色低碳),而華為也正是沿著這三條路徑向前推進AIDC建設的。
而RAS理念中,最為重要的就是“R”——安全。AIDC的安全底線不僅關乎設備存續,更決定算力服務的連續性。“安全是1,沒有安全,一切都是0。”
IDC的安全可靠不僅是某個環節的安全可靠,更是要構建涵蓋數據中心全生命周期的防護體系。不同于傳統數據中心的單點防護思維,華為構建了覆蓋產品、架構、管理、運維的四層防護體系,實現從器件到系統的全生命周期可靠。
數據中心安全體系化,首先要做的就是將原有的集中式的架構轉變為分布式架構。摒棄集中式設計,確保單一故障點不會引發系統性崩潰。例如,制冷系統需要實現風冷或液冷單元相互隔離,按需部署,一臺故障時其他單元能迅速補上冷量。
其次是主動安全,特別是在高風險環節如鋰電池儲能上。智算時代,通過鋰電池取代原有占地面積大、生命周期短的鉛酸電池,已經成為數據中心降低后續運營成本,提升數據中心“白空間”面積的重要舉措之一。
作為國內較早探索鋰電池應用的企業之一,華為在數據中心鋰電池安全方面提出了“既要快速響應,也要預知風險”的策略。石憶告訴筆者,鋰電池出現安全風險之時實現快速處置,避免損失僅僅是基礎操作,更為重要的是,在故障發生前就能精準定位并更換有風險的電池,如此才能將風險降到最低。目前,華為對鋰電池告警的覆蓋率達到了92%,報警的準確率是97%,而且這個告警最高可以提前七天。
彈性需求如何滿足?
“行百里者半九十”,當安全基礎“打牢”之后,如何滿足用戶在智算時代的需求,成為服務商能否獲得更多份額的關鍵。“智算時代唯一不變的就是變化,彈性是應對變化的唯一選擇”——這句話已經成為行業內公認的事實,也指出了當前很多數據中心“建成即過時”的痛點。
面對此,華為給出了“解耦化、模塊化、預制化、高密融合”的“四化”解決方案。通過此,讓AIDC建設速度與IT技術迭代實現同頻共振,相較于傳統方案,將數據中心的交付周期縮短60%以上。
這個過程中,最為重要的一步是——實現子系統的解耦。傳統數據中心,基礎設施層與服務器的供配電、供冷系統是緊耦合的狀態,一旦一方發生變化,無異于將數據中心“推倒重建”。即便在通算時代,一代服務器的“壽命”平均在5年左右,而數據中心基礎設施層的“壽命”則應在10~15年左右。這也就意味著,一個數據中心需要兼容三代服務器的更迭。
而當時間來到智算時代,服務器更迭速度只會比通算時代快,緊耦合的狀態,對于需求敏捷的客戶來說,一點也不敏捷。所以,在石憶看來,數據中心實現彈性的第一步就是實現解耦。“華為將AIDC拆分為IT、供配電、制冷三大獨立子系統,實現串行施工向并行施工的轉變。”石憶介紹道。
在華為云(蕪湖)數據中心項目中,基礎設施與服務器的解耦設計,使得機電安裝僅用71天完成,較傳統方案節省50%時間,整體項目耗時3個月。不僅于此,石憶表示,這種設計還支持“按需擴容”,“客戶可先部署基礎框架,待確定服務器功率后再上配電單元。”石憶進一步指出。
當系統都實現解耦之后,就可以進一步通過模塊化的方式,在工廠預生產后,進行現場組裝即可完成數據中心建設。
互聯網“快”的特點也在新一輪人工智能的浪潮下得以延續,用戶對于數據中心交付周期的要求也越來越高。模塊化似乎已經逐漸成為近年來數據中心建設的主流方式,石憶告訴筆者,模塊化不是終點,還要將模塊預制化,減少現場施工工程量,將現場的設備安裝、集成、調試提前到工廠來完成,實現工程產品化。其最大的價值就是用工廠的標準化、高質量生產和測試,確保了高效率以及高質量,把現場的工程變得最小化,極大減少現場安裝,助力AIDC快速高質量建設。
通過模塊化方式,還能實現硬件設備的即插即用——通過預留通用接口的方式,讓后續無論是制冷系統,還是服務器的更換都可以“傻瓜式”即插即用,進一步提升了部署速度。
不僅于此,模塊化的方式,還能大幅降低數據中心在建設過程中的碳排放,實現全生命周期內的降碳,這點也正好呼應了RAS理念中——綠色低碳。
綠色低碳從“責任”變成“生存需求”
在“雙碳”目標與能源危機的雙重驅動下,綠色低碳已從社會責任升級為AIDC的生存需求。傳統模式下,IDC服務商與客戶都存在“降低能耗總量”的誤區。然而,隨著機柜功率不斷攀升,降低總能耗已經是一條“不可行之路”,面對此,華為提出了“提升系統效率”的核心思路,通過高效供電、高效制冷、系統高效、算電協同等四大路徑,實現全鏈路降碳。
高效供電方面,通過技術創新降低損耗。例如,華為UPS在S-ECO模式下效率高達99.1%。
高效制冷方面,隨著智算時代液冷的普及,制冷能耗得到進一步降低,但風冷系統仍將繼續存在,風冷和液冷系統走向融合化,冷源統一化,通過AI手段對制冷系統做系統級能效調優,進一步降低制冷能耗,提升制冷效率。
系統協同方面,通過系統協同,實現能源與算力的智能匹配。“打通L1能源基礎設施與L2算力基礎設施的信息流,通過AI算法根據負載波動調節設備狀態,讓每瓦電力都能承載更多算力。”石憶強調。
算電協同方面,綠電直供,就近消納是目前數據中心綠色低碳化的不可或缺的一步,而從國家規劃的八個算力樞紐節點布局上就不難看出國家在綠電直供,就近消納的布局。八個節點除了北上廣這樣的一線算力需求高度集中的城市之外,其余節點幾乎都處于盛產綠電的地方。
在面對行業存在“安全與低碳不可兼得”的誤區——認為冗余設計會增加能耗,節能措施會犧牲安全,石憶表示,高安全與高能效可以協同實現,關鍵在于系統級的優化設計。
整體來看,數據中心正在向超高功率、超高密度和超大規模發展,智算中心的建設不僅是應對當前挑戰的務實選擇,更是贏得未來AI競爭的戰略布局。同時數據中心的設計思路也在變化,從“大系統”向“標準化+模塊化分布式架構”演變,更彈性應對未來需求的不確定性,此外還要從軟硬件層面考慮網絡安全、供應安全和備電安全等問題。
可以說,AI算力的洪流既帶來了“最好的時代”的機遇,也引發了“最焦慮的時代”的挑戰。在這場AIDC變革中,唯有以全棧專業能力與經驗沉淀為底色,才能實現智能進化、再造卓越,而華為正在這條路上挺進。(文|Leo張ToB雜談,作者|張申宇,編輯丨蓋虹達)





京公網安備 11011402013531號