快科技11月6日消息,如今的AI芯片越發強大,也越發“饑渴”,微軟CEO納德拉都感慨電力供應已經跟不上,NVIDIA可謂難辭其咎。
根據摩根士丹利的最新報告,NVIDIA Blackwell Ultra GB300 NVL72機架式AI服務器系統中,單單是液冷散熱組件的價值就高達49860美元,約合人民幣近36萬元,這已經比GB200 NVL72系統高了大約20%。
這還沒完。
下一代系統的功耗將進一步增加,因此預計Vera Rubin NVL144服務器的液冷系統成本將再次增加17%,達到55170美元,約合人民幣近40萬元。

根據這份報告,GB300 NVL72服務器包含18個計算托盤,每顆GPU芯片功耗1400W,每個計算托盤的功耗至少6600W,為此需要6200W的散熱能力,單個液冷成本約2260美元,18個總計40680美元。
另外還有9個NVSwitch交換機托盤,單個液冷成本約1020美元,9個總計9180美元。
不出意外,整個液冷散熱系統中,最昂貴的組件是為GPU、CPU定制的高性能液冷板,每個要300美元,還有為NVSwitch交換機定制的冷板,每個也要200美元。
摩根士丹利預計,下一代Vera CPU、Rubin GPU的功耗會更高,其中GPU將高達1800W,還有NVSwitch 6.0交換機也會更耗電,散熱成本也就隨之水漲船高。
其中,每個計算托盤的散熱成本增加18%,達到2660美元,其中更大容量的冷板成本增至400美元,而托盤總量不變,合計47880美元。
好消息是交換機托盤的散熱成本會降低大約15%,每個870美元,合計7830美元。

再往后的Rubin Ultra,將會改為每個GPU封裝內集成4個計算模塊、16個HBM4E內存模塊,熱設計功耗大幅提升至3600W,從而需要新的液冷板,甚至是浸沒式液冷。
同時,NVIDIA正在準備新的NVL576機架方案,包含多達144顆GPU,比現在多一倍,散熱成本自然會急劇增加。
當然,跟我們沒啥關系……






京公網安備 11011402013531號