IT之家12月23日消息,上海交通大學(xué)“致遠(yuǎn)一號”于今日全面建成啟用,是全國高校最大的國產(chǎn)智算算力基礎(chǔ)設(shè)施,本地部署了包含 DeepSeek 在內(nèi)的8款主流大模型。
![]()
上海交大報道截圖
根據(jù)上海交通大學(xué)高性能計算中心介紹,“致遠(yuǎn)一號”平臺硬件配置包括 1024張華為昇騰910B 加速卡,F(xiàn)P16峰值算力313P,配合 Pacific 分布式存儲與 BurstBuffer 架構(gòu),總存儲容量13.6PB。
計算方面,“致遠(yuǎn)一號”配備101臺 CPU 節(jié)點,形成5000+ vCPU 的通用計算池;云服務(wù)支持 IaaS、PaaS、SaaS 全棧功能,具備異構(gòu)算力調(diào)度與云化彈性部署,能夠滿足教學(xué)、科研和管理等多樣化需求。
“致遠(yuǎn)一號”的網(wǎng)絡(luò)與算力資源由智算集群區(qū)、云平臺區(qū)和存儲區(qū)構(gòu)成:
智算集群區(qū)部署128臺 Atlas 800T A2昇騰服務(wù)器,共1024張 NPU 卡,峰值算力320P,每機(jī)柜安裝5臺,單柜功率30kW。網(wǎng)絡(luò)架構(gòu)分為參數(shù)面(200GE RoCE,1:1收斂,32臺 CE9855 Leaf + 16臺 CE9855 Spine)、業(yè)務(wù)面(100GE,SDI 智能網(wǎng)卡,8臺 CE8850 Leaf + 2臺 CE9865-4C Spine)和樣本面(25GE RoCE,1:1收斂,8臺 CE6865E Leaf + 4臺 CE8850 Spine)。云平臺區(qū)基于 HCSO 和 ModelArts,配置101臺鯤鵬 Taishan 200 2280 V2服務(wù)器及60臺網(wǎng)絡(luò)設(shè)備,并提供2PB 云對象存儲、1PB 云塊存儲和1.6PB 云文件存儲。存儲區(qū)采用全閃與混閃架構(gòu),全閃 Pacific 9950提供43節(jié)點、6.5PB 容量,混閃 Pacific 9550提供12節(jié)點、2.5PB 容量,為并行計算與大規(guī)模模型訓(xùn)練提供高效數(shù)據(jù)支撐。
機(jī)房建設(shè)方面,該平臺共設(shè) 52個47U 加高機(jī)柜,分布在3組封閉微模塊中,其中34個用于智能計算服務(wù)器(單柜功率30kW),18個用于存儲和網(wǎng)絡(luò)服務(wù)器(單柜功率20kW)。
“致遠(yuǎn)一號”的供電系統(tǒng)額定功率960kW,機(jī)房配電總功率1380kW,采用小母線架構(gòu),每個機(jī)柜配備雙路 PDU,存儲和網(wǎng)絡(luò)機(jī)柜還接入 UPS,斷電可維持15分鐘不間斷供電。
“致遠(yuǎn)一號”的制冷系統(tǒng)配置30臺風(fēng)冷列間精密空調(diào),單臺60kW,按“N+2”冗余方案部署,總制冷功率1440kW,并采用氟泵雙循環(huán)自然冷卻技術(shù),全年綜合 PUE(IT之家注:數(shù)據(jù)中心消耗的所有能源與 IT 負(fù)載消耗的能源的比值,越接近1表明能效越高)約1.3。
![]()
“致遠(yuǎn)一號”數(shù)據(jù)圖
類型設(shè)備參數(shù)數(shù)量計算CPU 節(jié)點CPU: 2*Kunpeng 920
Mem:
2048GB DDR5(4800MHZ)
512GB DDR5(4800MHZ)
1024GB DDR5(4800MHZ)
101NPU 節(jié)點CPU:4*Kunpeng 920
NPU: 8 * 昇騰 AI 處理器128存儲高性能分布式存儲節(jié)點可用容量:2.5PB
型號:OceanStor Pacific 9950
主存盤:7.68T NVMe SSD*1043高容量分布式存儲節(jié)點可用容量:6.5PB
型號:OceanStor Pacific 9550
主存盤:16T SATA HDD *5012云存儲總可用容量:4.6PB1網(wǎng)絡(luò)參數(shù)面高性能交換機(jī)主型號:CE9855-32DQ
端口:32 x 400GE + 2 x 10GE
交換容量:25.6Tbps
包轉(zhuǎn)發(fā)率:8000Mpps48樣本面高性能交換機(jī)主型號:CE8850-64CQ-EI
端口:64 x 100 GE
交換容量:12.8Tbps / 204.8Tbps
包轉(zhuǎn)發(fā)率:4,482Mpps24
上海交通大學(xué)官方介紹顯示,該校于2012年成立高性能計算中心,2013年建成“交我算”的第一個集群 π1.0,再到今天“致遠(yuǎn)一號”平臺全面落地,“交我算”品牌已經(jīng)有10多年的發(fā)展歷程。
上一代“思源一號”高性能計算平臺建于2021年,總算力6 PFLOPS(每秒六千萬億次浮點運算):
CPU 采用雙路 Intel Xeon ICX Platinum 8358 32核,主頻2.6GHz,共938個計算節(jié)點;GPU 采用 NVIDIA HGX A100 4-GPU,共23個計算節(jié)點。采用聯(lián)想第五代溫水冷技術(shù),與通用風(fēng)冷計算設(shè)備相比,節(jié)省電力和減少二氧化碳排放42%;計算節(jié)點之間使用 Mellanox 100 Gbps Infiniband HDR 高速互聯(lián),并行存儲的聚合存儲能力達(dá)10 PB;集群額定功率900kW,其中 IT 設(shè)備額定功率800kW,制冷、配電設(shè)備額定功率100kW;單機(jī)柜(水冷)額定功率55kW,機(jī)柜總數(shù)18個,PUE 約1.10。
![]()
“交我算”品牌已經(jīng)有10多年的發(fā)展歷程





京公網(wǎng)安備 11011402013531號