華為發(fā)布開源AI容器技術Flex:ai：讓閑置算力“動起來”，把一張卡切給多任務使用丨最前線

IP屬地中國·北京 36氪 時間：2025-11-25 22:20:10

文｜富充
編輯｜蘇建勛
當前，“算力不夠用”和“算力被浪費”正在同時發(fā)生。
36氪獲悉，近日舉行的2025AI容器應用落地與發(fā)展論壇上，華為公司正式發(fā)布AI容器技術——Flex:ai，通過三項技術創(chuàng)新提升算力資源利用率。同時，華為聯(lián)合上海交通大學、西安交通大學與廈門大學共同宣布，共同開源此項產(chǎn)學合作成果。
本次發(fā)布并開源的XPU池化與調(diào)度軟件Flex:ai，是基于Kubernetes（一個廣泛使用的容器管理平臺）構建。簡單理解，它通過對GPU、NPU等智能算力資源的精細化管理與智能調(diào)度，一邊把零散的算力統(tǒng)一成“資源池”，一邊把不同規(guī)模的 AI 任務智能分配進去。
具體而言，F(xiàn)lex:ai 主要有三項核心能力：
在解決小模型訓練推理場景資源浪費方面，華為與上海交通大學聯(lián)合研發(fā)的XPU池化框架，將單張GPU或NPU算力卡按10%的精度切分為多個虛擬算力單元，實現(xiàn)“用多少，切多少”，使此類場景下的整體算力平均利用率提升30%；
為了將集群里不同機器上的空閑算力聚合起來，華為與廈門大學研發(fā)的跨節(jié)點拉遠虛擬化技術，把集群內(nèi)各節(jié)點的空閑XPU算力聚合形成“共享算力池”，讓不具備智能計算能力的通用服務器也能通過網(wǎng)絡調(diào)用遠端GPU/NPU資源參與AI計算；
面對算力集群中多品牌、多規(guī)格異構算力資源統(tǒng)一調(diào)度的挑戰(zhàn)，華為與西安交通大學共同推出的Hi Scheduler智能調(diào)度器，能夠感知集群里多品牌、多規(guī)格算力資源的狀態(tài)，根據(jù)任務優(yōu)先級、算力需求等參數(shù)，自動選擇合適的本地或遠端資源，實現(xiàn)分時復用和全局最優(yōu)調(diào)度，讓系統(tǒng)決策“哪塊卡該干哪份活”。
華為表示，此次Flex:ai的全面開源，將向產(chǎn)學研各界開發(fā)者開放所有核心技術能力，共同推動異構算力虛擬化與AI應用平臺對接的標準構建，形成算力高效利用的標準化解決方案。

免責聲明：本網(wǎng)信息來自于互聯(lián)網(wǎng)，目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點。其內(nèi)容真實性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權益，請及時聯(lián)系我們，本站將會在24小時內(nèi)處理完畢。

同類資訊

谷歌把AI大模型能力“壓縮”進手機，以后玩游戲全靠“吼”

培訓即上崗！一條閉環(huán)服務鏈，打通就業(yè)“最后一公里”

摩爾線程張建中：智算集群將做到50萬卡、100萬卡規(guī)模

科技前沿｜可控核聚變終極能源解決方案值得期待

摩爾線程，突發(fā)大消息！

中國社科院揭露11家冒名機構期刊，有的曾舉辦大型發(fā)布會

全站最新

谷歌把AI大模型能力“壓縮”進手機，以后玩游戲全靠“吼”

培訓即上崗！一條閉環(huán)服務鏈，打通就業(yè)“最后一公里”

摩爾線程張建中：智算集群將做到50萬卡、100萬卡規(guī)模

科技前沿｜可控核聚變終極能源解決方案值得期待

熱門推薦

鞏固千元價格帶、重啟“小五糧”，五糧液系統(tǒng)布局三大戰(zhàn)略方向

央視《鴻蒙星光盛典》今晚播出

王力宏演唱會上！機器人高難度空翻獲馬斯克稱贊

摩爾線程，重大發(fā)布！

谷歌把AI大模型能力“壓縮”進手機，以后玩游戲全靠“吼”

培訓即上崗！一條閉環(huán)服務鏈，打通就業(yè)“最后一公里”

摩爾線程張建中：智算集群將做到50萬卡、100萬卡規(guī)模

科技前沿｜可控核聚變終極能源解決方案值得期待

巴西電動“飛行汽車”原型機完成首飛

摩爾線程，突發(fā)大消息！

中國社科院揭露11家冒名機構期刊，有的曾舉辦大型發(fā)布會

華為鴻蒙電腦MateBook Pro推送HarmonyOS 6.0.0.120 SP1版本

NASA毅力號火星車完成自主長距離行駛：4個多小時走了412米

上半年虧超6億，又一國產(chǎn)GPU獨角獸沖刺港股IPO

豆包狂飆，字節(jié)AI再亮劍