當(dāng)前位置：首頁 ? 資訊 ? 新科技 ? 正文

華為數(shù)據(jù)存儲、中科弘云發(fā)布AI推理加速聯(lián)合解決方案

IP屬地中國·北京 IT之家 時間：2025-12-23 18:21:39

IT之家 12 月 23 日消息，華為數(shù)據(jù)存儲與中科弘云今日發(fā)布了 AI 推理加速聯(lián)合解決方案。
該方案以華為 OceanStor A 系列存儲為數(shù)據(jù)底座，結(jié)合中科弘云智算互聯(lián)網(wǎng)云服務(wù)平臺 HyperCN 平臺，優(yōu)化長序列推理體驗(yàn)。

該方案深度融合華為 OceanStor A 系列存儲、華為 UCM 推理記憶數(shù)據(jù)管理技術(shù)以及中科弘云 HyperCN 平臺能力，通過 KV Cache 多級緩存管理、秒級算力調(diào)度、分鐘級推理大模型部署及全流程 AI 工具鏈，將智能算力輸送至業(yè)務(wù)一線。該聯(lián)合方案的核心優(yōu)勢如下：
異構(gòu)管理：支持平臺、計算與存儲的協(xié)同聯(lián)動，適配英偉達(dá)、華為昇騰、寒武紀(jì)等多元 AI 算力，兼容 MindSpore / vLLM/SGLang 等主流框架，并通過 Kubernetes 與華為 OceanStor A 系列存儲實(shí)現(xiàn)無縫對接。算力調(diào)度：對算力資源進(jìn)行細(xì)粒度切分與池化處理，按需靈活調(diào)度，實(shí)現(xiàn)資源利用率最大化；具備集群作業(yè)調(diào)度、運(yùn)維監(jiān)控、故障恢復(fù)等功能，支持分鐘級任務(wù)恢復(fù)與系統(tǒng)健康監(jiān)測。推理加速：依托華為 UCM 技術(shù)，將 KV Cache 持久化至華為 OceanStor A 系列存儲，實(shí)現(xiàn)推理記憶全量保存，減少重復(fù)計算；此外，融合 Prefix Cache、GSA 稀疏加速等算法，顯著降低首 Token 時延（TTFT），使長序列推理吞吐與體驗(yàn)實(shí)現(xiàn)倍數(shù)級提升。端到端 AI 工具鏈：覆蓋數(shù)據(jù)管理標(biāo)注、算法開發(fā)、大小模型訓(xùn)練推理、智能體開發(fā)等全流程，支持傳統(tǒng)機(jī)器學(xué)習(xí)與深度學(xué)習(xí)開發(fā)，實(shí)現(xiàn) AI 資產(chǎn)的統(tǒng)一建設(shè)與集中管理。
經(jīng)實(shí)測，在智能問答的典型推理場景中，該方案實(shí)現(xiàn)首 Token 時延（TTFT）降低 57.5%，且序列長度越長，優(yōu)化效果越顯著；在長文檔推理場景中，結(jié)合 GSA 稀疏加速算法，當(dāng)序列長度為 39K 時，并發(fā)能力提升 86%，推理吞吐提升 36%，提升推理效率與體驗(yàn)。
IT之家從合作公告獲悉，該聯(lián)合方案目前已在能源電力、智能制造、國家實(shí)驗(yàn)室等關(guān)鍵行業(yè)啟動試點(diǎn)應(yīng)用。

免責(zé)聲明：本網(wǎng)信息來自于互聯(lián)網(wǎng)，目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點(diǎn)。其內(nèi)容真實(shí)性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系我們，本站將會在24小時內(nèi)處理完畢。

同類資訊

蘋果明年必推折疊iPhone、GPU/TPU將長期共存，郭明錤萬字訪談揭秘AI和消費(fèi)電子競爭格局

租機(jī)器人對顧客開啟夸夸模式？海底撈打算用智元共享機(jī)器人試一試

百萬獎金 + 全鏈路服務(wù)加持！2025 咪咕閱讀創(chuàng)作者大會升級扶持體系，聚力內(nèi)容創(chuàng)新

著名雷達(dá)與空間電子技術(shù)專家、中國工程院院士黃培康逝世

京東法國倉庫被盜，或涉及超3億元商品

團(tuán)隊準(zhǔn)備休假：Windows Insider 2026年前沒有新版本了

全站最新

蘋果明年必推折疊iPhone、GPU/TPU將長期共存，郭明錤萬字訪談揭秘AI和消費(fèi)電子競爭格局

租機(jī)器人對顧客開啟夸夸模式？海底撈打算用智元共享機(jī)器人試一試

百萬獎金 + 全鏈路服務(wù)加持！2025 咪咕閱讀創(chuàng)作者大會升級扶持體系，聚力內(nèi)容創(chuàng)新

著名雷達(dá)與空間電子技術(shù)專家、中國工程院院士黃培康逝世

熱門推薦

蘋果明年必推折疊iPhone、GPU/TPU將長期共存，郭明錤萬字訪談揭秘AI和消費(fèi)電子競爭格局

九學(xué)王劉衍兵：AI時代，任何應(yīng)用場景都離不開終端載體

租機(jī)器人對顧客開啟夸夸模式？海底撈打算用智元共享機(jī)器人試一試

百萬獎金 + 全鏈路服務(wù)加持！2025 咪咕閱讀創(chuàng)作者大會升級扶持體系，聚力內(nèi)容創(chuàng)新

著名雷達(dá)與空間電子技術(shù)專家、中國工程院院士黃培康逝世

京東法國倉庫被盜，或涉及超3億元商品

團(tuán)隊準(zhǔn)備休假：Windows Insider 2026年前沒有新版本了

要當(dāng)"機(jī)器人界的滴滴"？智元「擎天租」上線，200元租一天！

全國首批“油改電”公務(wù)船舶在長江干線投入使用

追覓進(jìn)軍路由器市場，首款產(chǎn)品12月25日發(fā)布

“黑五”小勝后，速賣通疑似對亞馬遜下“戰(zhàn)書” 1月7日杭州見！

聊天機(jī)器人只是過客？谷歌押注“世界模型”，寄希望智能眼鏡成為AI真正“殺手級”應(yīng)用

安全專家：快手遭遇網(wǎng)絡(luò)攻擊非偶發(fā)，必須用AI對抗AI

當(dāng)行業(yè)都在談AI風(fēng)口，這家公司默默發(fā)了23年頂級論文

小米YU7硬剛奔馳GLC？小米高管：奔馳是面子，小米是里子