亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

剛剛,華為AI推理大招終于來了!10倍級上下文擴展,性價比暴漲

IP屬地 中國·北京 編輯:顧青青 智東西 時間:2025-08-12 20:21:50


智東西
作者 ZeR0
編輯 漠影

智東西8月12日報道,今日,華為推出AI推理創新技術——推理記憶數據管理器UCM,通過多級緩存顯著優化AI推理體驗與性價比。


UCM是一款以KV Cache記憶管理為中心的推理加速套件,提供全場景系列化推理加速方案,通過推理框架、算力、存儲三層協同,優化Tokens在各業務環節中流轉的效率,以實現AI推理的更優體驗、更低成本。

其三大組件包括對接不同引擎與算力的推理引擎插件(Connector)、支持多級KV Cache管理及加速算法的功能庫(Accelerator)、高性能KV Cache存取適配器(Adapter),并通過開放統一的南北向接口,可適配多類型推理引擎框架、算力及存儲系統。

經大量測試驗證,UCM可將首Token時延最高降低90%,系統吞吐最大提升22倍,實現10倍級上下文窗口擴展。

華為計劃在今年9月正式開源UCM,屆時將在魔擎社區首發,后續逐步貢獻給業界主流推理引擎社區,希望通過開放開源的方式,讓業界共享這一成果,共同推動AI推理生態的繁榮發展。

同時,華為與中國銀聯率先在金融典型場景開展UCM技術試點應用,并聯合發布智慧金融AI推理加速方案應用成果。

會后,華為數據存儲產品線副總裁、閃存領域總裁謝黎明,華為數據存儲產品線AI存儲首席架構師李國杰,與智東西等媒體進行深入交流。

李國杰強調,用AI處理更高級別的問題,信息量和數據輸出會更大,UCM則能夠大幅優化成本。今天發布的UCM,是華為第一次提供如此完整的全流程、全場景且可演進的系統性方案。從單點算力模組轉向系統級優化,是一個大的變化和趨勢。業界有很多開源方案有類似的方向,有的是做了其中某一層或某一些組件,但是并未看到可商用的端到端完整方案。

謝黎明談道,開源UCM與業界思路是一致的,華為希望通過開放這些成果,為推理體驗、生態、成本貢獻一份力量,進一步促進框架、存儲、GPU廠商共建和成熟化整套機制,真正解決AI行業化落地的效率和成本問題。

一、優化AI推理體驗:10倍級上下文窗口擴展,TTFT最高降低90%,Token經濟性提升2倍+華為公司副總裁、數據存儲產品線總裁周躍峰談道,AI在金融行業大規模使用,推理效率與體驗是關鍵。AI時代,模型訓練、推理效率與體驗的量綱都以Token數為表征,Token經濟時代到來。

AI推理應用落地過程中面臨三大挑戰:

推不動(輸入超出模型上下文窗口)推得慢(美國大模型推理首Token時延=中國大模型的1/2)推得貴(美國大模型推理吞吐率大約是中國大模型的10倍)

對此,華為推出UCM推理記憶數據管理器(Unified Cache Manager),通過多級緩存解決AI推理體驗與成本問題。


整個AI推理系統中的記憶有三部分:高帶寬內存HBM、DRAM都在智算服務器中,可以充分利用但過去沒有利用起來的是下面的專業共享存儲。


通過一系列算法,UCM把推理過程中有不同延時要求的數據放在不同的記憶體中,實時記憶數據即熱放在HBM中,短期記憶數據放在DRAM,其他放在共享專業存儲中,通過這樣的按需流動來提升整個系統的效率。

UCM主要分為三部分:頂層是推理引擎插件(Connector),與業界多樣引擎與多元算力靈活對接,會連接MindIE、SGLang等一些主流推理引擎框架;中間是對緩存記憶數據進行分級管理的一些創新加速算法,運行在智算服務器中;另一部分是與專業共享存儲相結合的存取適配器,能提升專業存儲的直通效率和降低時延,可以讓三級存儲更好協同。


通過大量測試,UCM能給推理系統的效率、體驗、成本提升帶來明顯進步。


(1)更快的推理響應:依托UCM層級化自適應的全局前綴緩存技術,可實現任意物理位置、任意輸入組合上的KV前綴緩存重用,在多輪對話、RAG知識檢索等場景中直接調用KV緩存數據,避免重復計算,使首Token時延最大降低90%、Token經濟性提升2倍+。


(2)更長的推理序列:通過動態KV逐層卸載、位置編碼擴展、Prefill稀疏等組合技術,將超長序列Cache分層卸載至外置專業存儲,通過算法創新突破模型和資源限制,實現10倍級推理上下文窗口擴展,滿足長文本處理需求。


(3)更低的推理成本:具備智能分級緩存能力,可根據記憶熱度在HBM、DRAM、SSD等存儲介質中自動分級緩存,同時融合多種稀疏注意力算法,實現存算深度協同,使長序列場景下TPS(每秒處理token數)提升2-22倍,降低每Token推理成本。

UCM受打字輸入法聯想的啟發,提供一套基于后綴檢索的預測聯想算法,將行業私域數據和用戶習慣構建token級的后綴索引,突破自回歸的聯想限制,可以一次輸出多詞,并且存得越多推得越快,比傳統MTP預測加速效果更好、更適用于企業場景。


二、面向開源設計,適配多類推理引擎框架、算力、存儲系統

KV Cache與記憶數據管理是大語言模型推理中優化性能、降低計算成本的核心技術。但國內AI推理生態中尚未形成以其為核心的完整加速軟件體系,相關技術布局存在短板。

隨著邁入Agentic AI時代,模型規?;瘮U張、長序列需求激增以及推理任務并發量增長,AI推理的KV Cache容量增長已超出HBM的承載能力,需要構建“軟件優化+硬件創新+存算協同”的架構。

UCM可根據數據冷熱分級存儲到不同介質中,使KV Cache容量從GB級增長至PB級,是一種更經濟、更易用的推理加速方案。

其設計理念是通過開放統一的框架和接口,北向支持多樣化的推理引擎連接,南向接入多樣化的存儲系統,中間在推理加速算法配置方面,開放并呼吁更多的開源和生態伙伴共建豐富的加速算法庫。


UCM面向開源設計,上層推理引擎插件接口積極融入主流的開源社區,中間層分級緩存管理接口與Mooncake聯合設計,在端到端的XPU直通存儲的存儲標準和產業接口的定義上與多家芯片廠商進行聯合定義。

華為希望聯合產業界的力量,共建共創以記憶數據管理為中心的推理加速新范式。

AI技術迭代飛速,因此UCM著眼于未來設計,從KV Cache分層管理走向Agentic AI原生記憶管理與應用加速,除了今年發布的推理加速套件(下圖黃色部分)之外,還會持續構建和發布面向Agent知識感知的多模檢索加速能力以及未來Agent原生記憶的管理和加速能力。


據李國杰透露,UCM大概從去年6-7月份開始孵化,至今差不多一年,僅是算法方面就有百人級團隊投入,未來會面向Agentic AI做更深演進,可能會繼續增加投入。

談到UCM與其他分級緩存管理的差別,李國杰總結了三點:

首先是納入專業存儲。很多分級緩存管理是管理一些裸金屬資源,效率不太能滿足商用客戶要求。納入專業存儲后,華為做了大量軟硬系統和卸載的事情,比如直通加速、KV Cache生命周期管理等。

第二,業界現有方案在算法加速庫方面幾乎只有傳統的Prefix Cache一種技術,并沒有像UCM這樣商用全流程稀疏算法、后綴檢索算法及其他算法。相較業界,華為貢獻了一些更加豐富、可靠的或加速效果更好的算法,這個算法庫還在持續增加中。

第三,推理場景非常豐富,請求輸入輸出變化多端,各場景下沒有一套框架、一套加速機制、一套算法是可以普適的,所以需要一套完整、絲滑、能在各場景、各種長短序列、各種請求下做自動切換和自動適應的方案,只有像UCM這樣真正跟客戶場景貼身聯創和迭代的技術才有這樣的能力。

三、技術價值已在智慧金融場景得到驗證

在與中國銀聯的聯合創新技術試點中,UCM的技術價值得到驗證。

在中國銀聯“客戶之聲”業務場景下,借助UCM技術及工程化手段,大模型推理速度提升125倍,僅需10秒即可精準識別客戶高頻問題,促進服務質量提升。


未來,中國銀聯計劃依托國家人工智能應用中試基地,聯合華為等生態伙伴共建“AI+金融”示范應用,推動技術成果從“實驗室驗證”走向“規模化應用”。

會上,中國信通院人工智能研究所平臺與工程化部主任曹峰分享了大模型推理優化的4個主要趨勢:

(1)大模型落地重心從訓練轉向推理,應用從ToC到ToB加速成熟;

(2)推理目標從單點優化和功能完備轉向“成本-性能-效果”三目標協同優化;

(3)系統級架構優化將成主流,頭部廠商2025年陸續推出推理系統級優化方案,未來結合“模型-場景-架構”的推理架構設計是技術、產業的發展重點;

(4)KV Cache是架構優化焦點,以KV Cache為核心的推理方案迭出,其背后依賴的高性能存儲、先進調度策略的重要性將愈發顯現。

結語:應對AI推理多重性能挑戰,UCM能有效緩解資源瓶頸

推理已成為AI下一階段的發展重心,直接關聯用戶滿意度、商業可行性等,重要性愈發凸顯。

AI推理從生成式AI時代的簡單推理任務,逐漸向Agentic AI時代的復雜長程推理任務發展,帶來了對算力計算量、內存訪問效率、超長上下文處理、Multi-agent狀態共享等方面的性能挑戰。

UCM可通過復用已計算結果、上下文窗口擴展、長記憶保持與共享等技術,減少重復計算與低效內存訪問,有效緩解復雜任務產生的資源瓶頸和性能挑戰。

通過融合多類型緩存加速算法工具,UCM能夠更大程度釋放KV Cache與推理框架的性能潛力,實現推理效率的顯著提升,并通過開源開放進一步加速探索優化商用AI推理方案的高效路徑。

免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

自拍偷拍国产精品| 国产欧美一区二区三区在线看蜜臂| 精品一卡二卡三卡四卡日本乱码| 欧美r级在线观看| 欧美视频一二三| 免费看污视频的网站| 日韩欧美精品久久| 日韩精品一区二| 国产在线不卡一区| 天堂av在线一区| 日韩 欧美 综合| 免费看91的网站| 亚洲精品自拍视频在线观看| 国产精品视频一二区| 99久久夜色精品国产网站| 亚洲精品写真福利| 欧美一卡二卡在线| 精品日韩av一区二区| 亚洲成人你懂的| 久久精品网站免费观看| 国产福利一区在线观看| 99久久久国产精品无码免费| 综合网五月天| 最近2019免费中文字幕视频三| 91美女在线观看| 91老师片黄在线观看| 国产成人精品aa毛片| 高h调教冰块play男男双性文| 影音先锋黄色网址| 内射无码专区久久亚洲| 少妇av在线播放| 国产情侣免费视频| 永久免费未视频| 中文字幕免费高清| 黄色一级片免费的| 国产精品三区在线| 亚洲国产另类久久久精品极度| 黄色一级二级三级| www.中文字幕在线| 日本大片免费看| 成人黄色在线观看| 国产亚洲视频在线| 九九久久综合网站| 日韩一区不卡| 日韩精品人妻中文字幕| 国产日本亚洲高清| 日韩成人高清在线| 国产精品区一区二区三在线播放| 激情欧美一区二区三区中文字幕| 国产精品丝袜久久久久久高清| 国产伦理一区二区三区| www国产黄色| 91久久久精品| 国产精品久久久久久婷婷天堂| 午夜一区二区三视频在线观看| 艳妇乳肉亭妇荡乳av| 亚洲精品卡一卡二| 欧美成人aaaaⅴ片在线看| 四虎永久免费地址| 国产精品国产精品88| 国产精品男女视频| 2021国产精品久久精品| 国产亚洲激情视频在线| 欧美人成在线观看| 国产成人精品片| 精品久久久久久久久久国产| 欧美精品v国产精品v日韩精品 | 精品国产一区二区三区久久影院 | 国产精品av在线播放| 国产精品一区二区三区毛片淫片| 日韩av一区二区在线观看| 欧美一级专区免费大片| 国产欧美日韩精品在线观看| 欧美一级大片免费看| 免费在线观看的毛片| 一级片免费在线观看视频| 日本妇女毛茸茸| 欧美在线观看成人| 久久福利免费视频| 国精品人妻无码一区二区三区喝尿| 欧美高清视频www夜色资源网| 一级特黄录像免费播放全99| 伊人手机在线视频| 天天亚洲美女在线视频| 欧美又大粗又爽又黄大片视频| 亚洲一区二区自拍| 妞干网在线视频观看| 天堂在线资源视频| 亚洲日本韩国在线| 日韩视频免费观看高清| 国产一级片免费看| 91麻豆福利精品推荐| 亚洲福利视频网站| 中文字幕v亚洲ⅴv天堂| 国产精品欧美久久久| 超碰成人在线播放| 丁香花在线影院观看在线播放| 印度午夜性春猛xxx交| 国产成人综合自拍| 97avcom| 亚洲护士老师的毛茸茸最新章节 | 欧美日韩加勒比精品一区| 国产三区二区一区久久| 国产精品一区二区入口九绯色| av网站在线免费看| 久久精品一区二区三区不卡 | 午夜精彩视频在线观看不卡| 一区二区三区四区乱视频| 精品视频1区2区| 尤物国产精品| 欧美 日韩 精品| 国产欧美精品一区aⅴ影院| 精品99久久久久久| 国产超碰91| 六月婷婷久久| 精品无码久久久久久久| 亚洲精品视频观看| 一本久久a久久精品vr综合| 亚洲中文字幕一区二区| 亚洲第一av网| chinese少妇国语对白| 国产精品久久久久久免费免熟| 久久亚洲精品国产精品紫薇| 欧美zozo另类异族| 国产精品加勒比| 免费看污黄网站在线观看| 免费的毛片视频| 免费观看日韩电影| 精品国一区二区三区| 另类小说色综合| 国产精品综合网| 日韩欧美在线网站| 神马影院我不卡| 亚洲国产日韩综合一区| 国产无码精品在线观看| 亚洲日本一区二区| 日韩jizzz| 少妇高潮一区二区三区99小说 | 免费久久久一本精品久久区| 黄色污污网站在线观看| 亚洲欧美日韩综合aⅴ视频| 91成人精品网站| 久久久天堂国产精品| 国产字幕在线观看| 亚洲一级二级在线| 亚洲综合最新在线| 毛片在线播放视频| 免费在线观看黄色av| 欧美午夜女人视频在线| 国产一区喷水| 三级黄色在线观看| 99久久婷婷国产综合精品| 有码中文亚洲精品| 自慰无码一区二区三区| 欧美理论电影在线播放| 久久精品国产sm调教网站演员| 日韩av电影天堂| 国产在线精品一区二区中文 | 绯色av蜜臀vs少妇| 国产精品久久久久久久久晋中| 中文字幕日韩一区二区三区不卡| 亚洲 日本 欧美 中文幕| 亚洲地区一二三色| 欧美久久精品一级黑人c片| av无码一区二区三区| 久久综合久久综合久久| 国产精品白嫩初高中害羞小美女 | av无码久久久久久不卡网站| 性一交一乱一伧老太| 一区二区成人av| 亚洲三级在线视频| 99久精品国产| 国产精品午夜av在线| 五月天婷婷导航| 日韩电影在线观看一区| 成人激情视频免费在线| 最好看的日本字幕mv视频大全| 国产成人精品免费久久久久| 日韩电影网1区2区| 国模一区二区三区私拍视频| 热久久久久久久| 五月天久久综合网| 国产精品久久免费看| 久久99精品久久久久久青青日本 | 欧日韩免费视频| 五月婷婷在线观看视频| 日韩午夜精品视频| av中文字幕av| ●精品国产综合乱码久久久久| 一区二区不卡视频| 午夜在线视频免费| 国产精品女同一区二区三区| 欧美精品尤物在线| 亚洲精品成人电影| 亚洲国产成人91porn| 国产无套内射久久久国产| 99国产欧美另类久久久精品| 日韩一级在线免费观看| 色悠悠亚洲一区二区| 久久久久亚洲av成人无码电影| 一区二区欧美在线| 亚洲影视一区二区| 国产精品一区视频| 国产美女明星三级做爰| 日韩风俗一区 二区| 波多野结衣电影免费观看| 国产精品成人一区二区艾草 | 天天av天天翘天天综合网色鬼国产 | 亚洲成人免费av| 男人添女荫道口图片| 日韩一级片免费观看| 中文字幕日韩有码| 欧美精品一区二区免费| 亚洲一区精彩视频| 水蜜桃久久夜色精品一区的特点| 成人h视频在线观看播放| 综合五月激情网| 欧美福利视频一区| 精品久久久久久无码国产| 亚洲欧美色一区| 激情成人在线观看| 欧美成人精品不卡视频在线观看| 久久激情五月激情| 无码aⅴ精品一区二区三区浪潮| 欧美视频中文一区二区三区在线观看| 中文视频在线观看| 91精品国产高清一区二区三区蜜臀| 色婷婷综合网站| 欧美亚洲愉拍一区二区| 91免费公开视频| 欧美激情精品久久久久久大尺度 | 国产 porn| 亚洲人成伊人成综合网久久久| 亚洲女人在线观看| 91精品综合久久久久久| 久久嫩草捆绑紧缚| 久久久av网站| 亚洲系列中文字幕| 精品人妻一区二区三区视频| 精品国产一二三| 99久久精品日本一区二区免费| 青春草在线视频免费观看| 亚洲精美色品网站| 国产精品456露脸| 国产一二三四在线视频| 久久精品这里热有精品| 精品一区二区三区影院在线午夜| 亚洲最新免费视频| 一片黄亚洲嫩模| 亚洲自拍偷拍图| 亚洲国产精久久久久久久| 国产特黄大片aaaa毛片| 91精品综合视频| 免费av网站观看| 成人免费自拍视频| 97se狠狠狠综合亚洲狠狠| 深爱五月激情网| 91在线网站视频| 丰满人妻一区二区三区免费| 欧美综合77777色婷婷| 亚洲精品va在线观看| 亚洲自拍偷拍图| 亚洲国产日韩在线一区模特| 99国产精品免费| 久久综合久久八八| 在线观看亚洲一区二区| 91精品久久久久久久久中文字幕| 天天干天天干天天| 麻豆乱码国产一区二区三区| 亚洲不卡免费视频| 国产自产在线视频| 疯狂做受xxxx欧美肥白少妇 | 久久久久久综合| 日本视频精品一区| 国产一区视频网站| 中文字幕欧美精品日韩中文字幕| 国产91av视频| 欧美一区二区高清在线观看| 久久精品影视伊人网| 亚洲人妖av一区二区| 91玉足脚交嫩脚丫在线播放| 欧美日本视频在线观看| 欧美激情视频网| ...av二区三区久久精品| 四虎国产成人精品免费一女五男| 91精品久久久久久久久久另类 | 在线观看av大片| 豆国产97在线| 欧美三级xxx| 7799精品视频天天看| 国产mv免费观看入口亚洲| 蜜臀av一区二区三区| 免费网站在线观看黄| 久久久久高清| 一级女性全黄久久生活片免费| 中文字幕狠狠干| 国产精品影片在线观看| 欧美日韩一区二区精品| 无码人妻aⅴ一区二区三区69岛| 精品偷拍各种wc美女嘘嘘| 手机精品视频在线观看| jizzzz日本| 国产欧美日韩亚洲精品| 国产亚洲精品激情久久| 欧美日韩免费在线| 成人爽a毛片一区二区免费| 成人av网站在线播放| 亚洲精品国产一区二区三区| 精品久久久久久一区二区里番| 亚洲第一福利网站| 日韩电影在线观看网站| 中文字幕乱码在线| 欧美成人免费大片| 亚洲国产cao| 中文字幕人妻丝袜乱一区三区| 日韩视频第二页| 91精品国产91| 国产精品一区二区三区网站| 少妇丰满尤物大尺度写真| 91tv亚洲精品香蕉国产一区7ujn| 色婷婷av一区二区三区软件 | mm131亚洲精品| 久久免费观看视频| 久久天天做天天爱综合色| 五月婷婷激情五月| 无限资源日本好片| 亚洲精品在线看| 99精品视频在线播放观看| 国产美女www| 欧美一级片在线免费观看| 欧美中日韩在线| 中文字幕在线亚洲精品| 蜜桃av噜噜一区二区三| 欧美在线视频免费观看| 亚洲激情视频在线播放| 国产精品久久久久久户外露出 | 日日噜噜噜噜人人爽亚洲精品| 亚洲欧洲日产国码无码久久99| 992tv在线成人免费观看| 一本色道**综合亚洲精品蜜桃冫| 激情文学综合插| 日本高清黄色片| 日本福利一区二区三区| 日韩一区二区欧美| 精品久久久久久久中文字幕 | 日韩av在线播放中文字幕| 97伦伦午夜电影理伦片| 无码精品a∨在线观看中文| 91精品国产成人| 国产人久久人人人人爽| 丰满人妻熟女aⅴ一区| 成人涩涩小片视频日本| 国产裸体舞一区二区三区| 欧美日韩一区在线观看视频| 国产精品免费一区二区三区在线观看 | 91久久中文字幕| 亚洲免费视频网站| 午夜视频一区在线观看| 另类综合日韩欧美亚洲| 亚洲 欧美 日韩 在线| 美女又黄又免费的视频| 亚洲欧美精品在线观看| 成人黄色免费看| 亚洲精品97久久| 久久精品人人做人人综合| a在线观看免费| 精品人妻中文无码av在线 | 一本色道久久综合亚洲精品小说 | 色av综合在线| aa级大片欧美| 摸摸摸bbb毛毛毛片| 亚洲一区二区三区精品动漫| 91精品国产一区二区三区| 刘亦菲久久免费一区二区| 精品少妇无遮挡毛片| 美女精品久久久| 国产三级一区二区| 欧美一级片免费在线观看| 男女猛烈激情xx00免费视频| 久久五月天色综合| 亚洲成成品网站| 日韩精品久久久久| 亚洲日本成人网| 亚洲欧美制服第一页| 伊人久久精品视频| 国产精品久久久久av| 欧洲成人午夜免费大片| 欧美大片在线免费观看| 久久精品国产91精品亚洲| 亚洲午夜色婷婷在线| 3d成人h动漫网站入口| 精品久久久久久中文字幕一区奶水| 99视频精品全部免费在线| 日韩精品成人一区二区三区| 久久五月激情| 国产黄a三级三级三级| 久久国产乱子伦精品| 99超碰在线观看| www.99re6| 欧产日产国产精品98| 国产91色在线观看| 久操网在线观看| 中文精品视频一区二区在线观看| 色噜噜色狠狠狠狠狠综合色一 | 婷婷久久综合九色综合伊人色| 久久久777精品电影网影网| 成人av网站在线观看| 成人sese在线| 老司机午夜精品| 日韩精品国产一区二区|