亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當(dāng)前位置: 首頁 ? 資訊 ? 新科技 ? 正文

即將開源!華為發(fā)布AI推理黑科技,已在中國銀聯(lián)落地

IP屬地 中國·北京 編輯:楊凌霄 鈦媒體APP 時間:2025-08-13 12:24:46


圖片系A(chǔ)I生成

8月12日,華為發(fā)布AI推理創(chuàng)新技術(shù)——UCM推理記憶數(shù)據(jù)管理器,旨在推動AI推理體驗升級,提升推理性價比,加速AI商業(yè)正循環(huán)。同時,華為攜手中國銀聯(lián)率先在金融典型場景開展UCM技術(shù)試點(diǎn)應(yīng)用,并聯(lián)合發(fā)布智慧金融AI推理加速方案應(yīng)用成果。

UCM推理記憶數(shù)據(jù)管理器,包括對接不同引擎與算力的推理引擎插件(Connector)、支持多級KV Cache管理及加速算法的功能庫(Accelerator)、高性能KV Cache存取適配器(Adapter)三大組件,通過推理框架、算力、存儲三層協(xié)同,實現(xiàn)AI推理“更優(yōu)體驗、更低成本”。

AI推理:既不夠快,也不夠便宜

從行業(yè)視角觀察,大模型的重心正在從訓(xùn)練轉(zhuǎn)向推理。相關(guān)行業(yè)數(shù)據(jù)顯示,當(dāng)前推理算力需求已超過訓(xùn)練(58.5%)。GPT-5開放首周20 億次/分鐘,70%的請求為復(fù)雜任務(wù)推理(如代碼生成、多步規(guī)劃);而國內(nèi)火山引擎的日均token調(diào)用量已達(dá)16.4萬億,其中70%以上來自線上推理而非訓(xùn)練。

與此同時,大模型行業(yè)總會頻繁出現(xiàn)一個現(xiàn)象,一旦出現(xiàn)了一種火熱的新模型,該服務(wù)商的服務(wù)在一段時間會處于不太穩(wěn)定的狀態(tài),這是因為大量用戶訪問需求之下,服務(wù)商需要通過計算、存儲等優(yōu)化措施,降低它的推理成本,并且降本的同時不能影響用戶體驗。

比如GPT-5發(fā)布就引起不少用戶詬病,通過智能路由降低后臺的算力成本,但是路由規(guī)劃的效果出現(xiàn)了偏差,用戶使用時頻繁出現(xiàn)了“降智”效果,海內(nèi)外用戶吐槽非常多。

此外,由于在基礎(chǔ)設(shè)施投資領(lǐng)域的差距,中國互聯(lián)網(wǎng)在AI基礎(chǔ)設(shè)施上的投資僅是美國的十分之一,疊加如算力卡閹割、算力卡漲價、HBM漲價等一系列因素,中國AI推理發(fā)展難上加難。

中國互聯(lián)網(wǎng)大模型首Token時延普遍慢于海外互聯(lián)網(wǎng)頭部的首Token時延,每秒或者一定時間內(nèi)推理的Token數(shù)也遠(yuǎn)小于海外頭部互聯(lián)網(wǎng)廠商。

國外主流大模型輸出速度為200 tokens/s區(qū)間(時延5ms),而中國普遍小于60 tokens/s(時延50~100ms),最大差距達(dá)到10倍。在上下文窗口上,海外模型普遍支持100萬級Token(如GPT-5、Claude 3.5),而國內(nèi)頭部(Kimi)僅50萬,且在長文本分析中,國內(nèi)模型遺漏關(guān)鍵信息的概率超50%。

行業(yè)通常用增加顯存、內(nèi)存的方式,提升AI推理的效率和性能,但是很多業(yè)界方案只關(guān)注基礎(chǔ)設(shè)施層,即分層流動/開啟管理,在整個算法加速庫上缺少系列場景化加速算法、套件以及開放第三方庫等舉措,即缺少一套“推理框架、算力、存儲三層協(xié)同”的方案。

以存代算,首token延遲降低90%

華為公司副總裁、數(shù)據(jù)存儲產(chǎn)品線總裁周躍峰解釋,以人的思考和大模型作對比,思考能力和記憶能力強(qiáng)相關(guān),AI推理系統(tǒng)也一樣的。整個AI推理系統(tǒng)當(dāng)中,記憶功能往往有三部分,高性能的緩存(HBM),中間是內(nèi)存(DRAM),這兩部分基本上在智算服務(wù)器當(dāng)中。第三部分是過去沒有得到利用的專業(yè)共享存儲。

UCM主要分為三部分:頂層和業(yè)界流行的推理框架對接,稱為“連接器”,它會連接業(yè)界普遍流行的推理引擎框架,包括華為的MindiE、SGLang等等,與目前推理框架進(jìn)行協(xié)同。

中間部分是加速程序,對于緩存記憶數(shù)據(jù)進(jìn)行分級緩存管理的算法程序,運(yùn)行在智算服務(wù)器當(dāng)中。

另外一部分是和專業(yè)共享存儲相結(jié)合的協(xié)同器,這個協(xié)同器(適配器)可以提升專業(yè)存儲直通的效率和降低時延,可以讓三級存儲協(xié)同起來。


通俗解釋,首先,華為通過UCM,將歷史已處理過的結(jié)果、歷史對話、語料庫、RAG知識庫的數(shù)據(jù)以KV Cache的形式緩存至第三層的高性能外置共享存儲上,遇到已推理過、已緩存過的信息就不需要重新推理了,而是只用從外置存儲中查詢并調(diào)用即可,實現(xiàn)大幅推理加速,將首token延遲降低90%、也節(jié)省了token by token的時間。

在過去,這些數(shù)據(jù)量通常較大、達(dá)到PB級,僅依賴HBM和DRAM這樣幾十GB、最多TB級的小容量是存不下來的,導(dǎo)致推理頻繁出現(xiàn)“失憶”,需要GPU反復(fù)計算、造成卡頓遲緩。而且過去HBM又貴又小、且與GPU卡強(qiáng)綁定,靠堆卡的形式普通企業(yè)根本買不起,只有被迫接受“重復(fù)造輪子”的低效方式。

在此基礎(chǔ)上,大模型能積累越來越多的歷史對話、歷史內(nèi)容,就變相地增加了知識豐富度和廣度,讓需要全新計算的比例越來越少,簡化計算復(fù)雜度,大模型也就越來越快、越來越聰明,如此解決“推得慢”的問題。

其次,當(dāng)推理任務(wù)越來越長、越來越復(fù)雜,長序列推理會讓大模型經(jīng)常出現(xiàn)“只有七秒鐘的記憶”。比如,在分析一篇萬字長文時,由于HBM容量有限,僅緩存到前2000字就裝不下了,這樣就容易出現(xiàn)推理失敗、關(guān)鍵關(guān)聯(lián)信息丟失的情況。

華為UCM通過一系列智能的算法,對長序列內(nèi)容進(jìn)行切片,并把已處理的切片卸載到更大的DRAM或外置共享存儲,這就變相擴(kuò)充了HBM的容量,讓上下文窗口擴(kuò)大10倍、滿足長序列推理需求。

此外,華為采用了注意力稀疏技術(shù)及相關(guān)技術(shù),可以識別這些大量KV Cache數(shù)據(jù)的重要程度、相關(guān)性和熱度,將重要的/不重要的、相關(guān)的/不相關(guān)的數(shù)據(jù)分層分級地進(jìn)行緩存并流動。在下一次推理過程中,只需要把關(guān)鍵的、合適的向量提取出來即可,這也就降低了向量推理過程中向量的數(shù)量,提升整體吞吐量,如此解決“推不動”的問題。

在無需過多投資的情況下,UCM讓長序列場景下TPS(每秒處理token數(shù))提升2-22倍,相當(dāng)于降低每Token推理成本,企業(yè)可以繼續(xù)維持算力不變,僅花銷小部分外置存儲的投資、讓緩存原地“升級”,從而改善推理效率、攤薄每token推理成本,解決“推得貴”的問題。

已在中國銀聯(lián)落地,9月將開源

金融行業(yè)是擁抱大模型較為快速的行業(yè)之一,對于新技術(shù)的需求也十分迫切。金融AI規(guī)模化落地的核心瓶頸在于高成本、高延遲、高依賴,金融級應(yīng)用需微秒級響應(yīng),而卡頓、延遲直接影響風(fēng)控與交易安全,因此AI推理的效果至關(guān)重要。

中國銀聯(lián)智能化創(chuàng)新中心副總經(jīng)理楊燕明表示,通過分析來自客服、工單等數(shù)據(jù)發(fā)現(xiàn)以下痛點(diǎn):金融產(chǎn)品、金融服務(wù)的種類多、場景復(fù)雜,在問題進(jìn)行分類時相當(dāng)困難;用戶反饋內(nèi)容繁雜的、冗長,導(dǎo)致難以分析原因。

中國銀聯(lián)嘗試使用大模型技術(shù)解決這些問題,通常的解決方案是,將問題進(jìn)行標(biāo)簽化,構(gòu)建起一系列的問題標(biāo)簽,結(jié)合客戶對話內(nèi)容進(jìn)行切片,喂給大語言模型進(jìn)行處理,希望通過大語言模型幫助解決分類問題。

但隨之發(fā)現(xiàn)了新的技術(shù)挑戰(zhàn),首先它是一個多次推理,推理時間非常長,一通電話或者一個服務(wù),需要長達(dá)15分鐘的分析時間;第二因為標(biāo)簽數(shù)量太多,分析準(zhǔn)確性非常低,無法應(yīng)用生產(chǎn)。

中國銀聯(lián)聯(lián)合華為開展了推理性能的技術(shù)攻關(guān),與華為存儲團(tuán)隊、算力先遣隊、業(yè)務(wù)專家一起組合了聯(lián)合創(chuàng)新小組,經(jīng)過一系列嘗試,提出了引入存儲的KV Cache的加速方案,滿足實際的業(yè)務(wù)需求。

采用KV Cache的方案,通使整個運(yùn)算方式從推理運(yùn)算,變?yōu)椴檎疫\(yùn)算和推理運(yùn)算相結(jié)合的方式,避免了大量重復(fù)推理,加速整個推理過程,實際效果標(biāo)簽分類的推理時間從原來的600秒,下降到10秒內(nèi),提升了50倍以上,標(biāo)簽分類準(zhǔn)確率從不到10%上升到80%,整個效果達(dá)到生產(chǎn)預(yù)期。

華為也公布了UCM開源計劃。UCM通過開放統(tǒng)一的南北向接口,可適配多類型推理引擎框架、算力及存儲系統(tǒng)。今年9月,UCM將正式開源,后續(xù)逐步貢獻(xiàn)給業(yè)界主流推理引擎社區(qū)。

華為相關(guān)專家表示,IT行業(yè)產(chǎn)品先行,標(biāo)準(zhǔn)隨后。華為希望通過UCM這樣一套開源的方式,能夠讓更多的廠商、業(yè)界存儲伙伴加入,能夠在推理加速推動標(biāo)準(zhǔn)落地,這是一個共創(chuàng)標(biāo)準(zhǔn)的過程,共同在開源社區(qū)孵化成熟,真正形成標(biāo)準(zhǔn),才能真正解決今天看到的推理體驗和推理成本的問題(本文首發(fā)于鈦媒體APP,作者 | 張帥,編輯 | 蓋虹達(dá))

免責(zé)聲明:本網(wǎng)信息來自于互聯(lián)網(wǎng),目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)。其內(nèi)容真實性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系我們,本站將會在24小時內(nèi)處理完畢。

久久人妻少妇嫩草av蜜桃| 中文字幕免费观看视频| 在线观看xxxx| 日韩在线观看免费高清完整版| 日本一区二区动态图| 国产麻豆成人精品| 精品国产综合久久| 永久免费看片直接| 亚洲一区二区在线免费观看视频| 欧美日本在线播放| 午夜精品福利一区二区三区蜜桃| 日韩精品另类天天更新| 欧美性xxxxx极品少妇| 国产情侣自拍小视频| 无码aⅴ精品一区二区三区浪潮 | 久草视频这里只有精品| 久久日一线二线三线suv| av激情久久| 亚洲久本草在线中文字幕| 欧美人与性囗牲恔配| 欧美唯美清纯偷拍| 日本在线不卡一区二区| 欧美精品videossex88| 亚洲奶汁xxxx哺乳期| 亚洲网站在线看| 亚洲综合av在线播放| 91福利视频在线| 国产欧美一区二区三区在线看蜜臂| 国产情人综合久久777777| 精品国产一区久久久| 久久久国产精华液999999| 日韩精品视频免费播放| 国产精品福利一区二区| 日本在线一区| 国产露脸91国语对白| 亚洲一区二区视频| 日韩一区二区三区久久| 日韩成人免费观看| www.黄色av| 日韩欧美久久久| 黄大色黄女片18免费| 欧美国产禁国产网站cc| 美女久久久久久久久| 一区二区三区四区| 日韩有码视频在线| 欧美精品videos| 国产精品免费在线免费| 欧美日韩午夜剧场| 国产精品第七页| 91精品国产综合久久香蕉最新版 | 亚洲成人在线免费| 人妻av无码一区二区三区| 国内免费久久久久久久久久久| 99热这里只有精品1| 日韩电影免费观看高清完整| 97超级碰碰| 91久久香蕉国产日韩欧美9色| 亚洲精品国产精品乱码不99| 久久久夜色精品| 亚洲男人的天堂在线播放| 精品人妻少妇AV无码专区| www.com.av| 精品一区二区三区电影| 久久这里有精品15一区二区三区| 欧美日韩色视频| 久久免费一级片| 日韩精品小视频| 亚洲国产成人无码av在线| 成年人黄色在线观看| 国产一区二区免费| 91久久久久久| 亚洲自拍偷拍第一页| 成人福利在线视频| 国产日韩欧美夫妻视频在线观看| 97欧美精品一区二区三区| 亚洲r级在线视频| 亚洲久草在线视频| thepron国产精品| 成人做爰视频网站| 亚洲精品国产精品国自产观看| 欧美精品一区二区三区蜜桃视频 | 久99久精品视频免费观看| 日韩一级片播放| 亚洲精品久久久久久久久久久 | 国产精品二区在线观看| 亚洲999一在线观看www| 99日在线视频| 久久久无码人妻精品无码| av免费中文字幕| 亚洲熟女www一区二区三区| 日本女人黄色片| 久久久久久久成人| 久久人人爽人人爽人人片av高清| 欧美激情视频给我| 亚洲精品午夜久久久| 国产精品视频第一页| 男人天堂视频网| 国产一级18片视频| 波多野结衣电车痴汉| 日本免费在线观看视频| 亚洲AV午夜精品| 欧美另类网站| 99c视频在线| 996这里只有精品| 日韩中文字幕三区| 天堂网免费视频| 日本在线不卡视频一二三区| 成人免费视频一区| 日日骚欧美日韩| 中文字幕视频网| 国产乱码在线观看| 9.1成人看片| 国产97在线 | 亚洲| 在线观看亚洲区| 一二三四区精品视频| 精品国产福利在线| 欧美一区二区三区四区久久| 国产在线一区观看| 久久精品99北条麻妃| 丰满圆润老女人hd| 男人天堂手机在线视频| 亚洲欧洲一二三| 亚洲午夜精品久久久久久高潮| www.亚洲在线| 91精品国产91久久久久久最新 | 国产又黄又猛又粗| 91久久精品国产91久久性色tv | 欧美国产激情视频| 中文字幕色一区二区| 一本色道久久99精品综合| 国产精品手机在线观看| 日本精品一二三| 青青草原国产视频| 亚洲一区和二区| 无码熟妇人妻av| 美女搡bbb又爽又猛又黄www| 国产欧美日韩综合精品一区二区三区| 91麻豆国产福利在线观看| 亚洲免费电影在线| av一本久道久久波多野结衣| 一级黄色性视频| 久久色.com| 69av一区二区三区| 在线视频你懂得一区| 国产精品国产三级国产普通话99 | 99视频在线免费播放| 7777精品伊久久久大香线蕉语言| 97av在线视频| 国产女人18毛片| 久草视频在线免费| 成人aa视频在线观看| 精品一区二区综合| 日韩激情一二三区| 成人免费一级视频| 亚洲欧洲日产国码二区| 久久久久国产精品麻豆ai换脸 | 777av视频| 久久久久久91亚洲精品中文字幕| 国产亚洲欧美日韩在线一区| 亚洲一卡二卡三卡四卡| 精品少妇一区二区30p| 日韩精品中文字幕有码专区| 91最新在线免费观看| 亚洲国产精品无码观看久久| 一区二区乱子伦在线播放| 懂色av中文字幕| 日韩av成人高清| 亚洲四区在线观看| 永久免费精品影视网站| 日韩激情久久| 无码人妻丰满熟妇区毛片蜜桃精品| 伊人色综合久久久| 国产精品久久久久久久久免费丝袜 | 一级成人免费视频| 亚洲丝袜av一区| 欧美高清视频一区二区| 精品国产乱码久久久久夜深人妻| 亚洲av成人无码网天堂| 人人妻人人澡人人爽人人欧美一区 | 亚洲一区二区三区四区精品| 亚洲电影免费| 中文字幕国内自拍| 99热这里只有精品4| 91福利在线观看视频| www.欧美日韩| 久热99视频在线观看| 国产香蕉精品视频一区二区三区| 欧美性xxxx69| 亚洲午夜无码久久久久| 日韩有码在线电影| 久久一级免费视频| 日韩午夜av一区| 国产日韩欧美在线看| 国产精品二区一区二区aⅴ| 九色|91porny| 色婷婷**av毛片一区| 日本sm极度另类视频| 免费久久久一本精品久久区| 久久精品国产69国产精品亚洲| 妺妺窝人体色www在线小说| 精品无码国产一区二区三区51安| 好吊操这里只有精品| 国产综合色在线| 蜜臀av午夜精品| 成人av手机在线| 国产亚洲精品综合一区91| 中文字幕影音先锋| 欧美一区二区三区小说| 国产精品久久久久无码av色戒| 精品久久久免费视频| 中文字幕精品在线视频| 国产欧美日韩在线播放| 欧美性大战久久久久xxx | 亚洲最色的网站| 成人精品水蜜桃| 丁香社区五月天| www.av亚洲| 日韩美女视频一区二区在线观看| 国产精品久久久久久久久久| 国产不卡视频在线| 亚洲一区二区三区在线视频| 免费观看日批视频| 丝袜情趣国产精品| 国产毛片久久久久久国产毛片| 午夜视频在线播放| 日本一区二区在线播放| 国产麻豆剧传媒精品国产| 欧美美女直播网站| 国产一区二区四区| 欧美色网一区二区| 97精品久久久午夜一区二区三区| 国产一区二区0| 中文字幕在线播放av| 伊人网视频在线| 欧美日韩成人激情| 日本韩国欧美在线观看| 成人性生交大合| 国产精品视频永久免费播放| 国产a级片免费看| 国产成人免费av在线| 亚洲激情综合网| 麻豆av免费在线| av亚洲精华国产精华| 日韩视频第二页| 欧美精品第1页| 真实乱视频国产免费观看| 日韩精品欧美国产精品忘忧草| 三区四区在线观看| 日本高清不卡aⅴ免费网站| y111111国产精品久久婷婷| 日韩在线观看视频一区二区三区| 国产午夜精品一区二区三区 | 天海翼在线视频| 一区二区三区在线视频免费| 亚洲三级视频网站| 国产精品69毛片高清亚洲| 成人欧美在线观看| 一级视频在线播放| 久久国产精品久久久久| 久久精品网站视频| 婷婷伊人综合中文字幕| 国产一区二区三区香蕉| 亚洲最大的免费| 久久影院亚洲| 欧美 国产 精品| 3atv一区二区三区| 黄色大片网站在线观看| 欧美日韩国产精品一区| heyzo国产| 不卡高清视频专区| 91九色国产社区在线观看| 天堂成人国产精品一区| 91成人在线看| 天天干天天摸天天操| 亚洲精品久久久久久久久久久久久| 激情五月婷婷久久| 91免费在线视频观看| 国产a级一级片| 日韩精品一区二| 久久国产在线观看| 欧美色综合久久| 午夜国产小视频| 久久久精品亚洲| 香港三日本三级少妇66| 亚洲电影在线观看| 91免费欧美精品| 国产伦精一区二区三区| 日韩一级免费看| 五月婷婷综合激情| 亚洲色图 激情小说| 91文字幕巨乱亚洲香蕉| 亚洲欧美日韩在线播放| 婷婷丁香综合网| 国产欧美精品一区二区三区| 中文字幕不卡在线观看| 中国老女人av| 日本中文字幕在线不卡| 又紧又大又爽精品一区二区| 亚洲欧洲国产精品久久| 姝姝窝人体www聚色窝| 午夜精品在线观看| 日本xxxxxxxxx18| 午夜精品成人在线视频| 免费裸体美女网站| 亚洲精品小视频在线观看| 影音先锋国产资源| 亚洲日本一区二区三区在线不卡| 亚洲自拍偷拍欧美| www色com| 麻豆精品传媒视频| 中文字幕日韩精品在线观看| 欧美黑人一级片| 成年人视频大全| 色偷偷888欧美精品久久久| 国产精品亚洲综合一区在线观看| 性欧美videossex精品| 亚洲欧美自拍一区| 午夜精品小视频| 古典武侠综合av第一页| 图片区小说区国产精品视频| 国产白丝一区二区三区| 97视频在线观看成人| 成人看片黄a免费看在线| 国产精品宾馆在线精品酒店| 精品国产999| 精品一区二区三区四区五区六区| 久久久久久国产精品美女| 一区二区三区中文在线观看| 国产黄a三级三级看三级| 欧美日韩在线观看一区二区三区| kk眼镜猥琐国模调教系列一区二区 | 久久久久欧美精品| 欧美性极品少妇精品网站| 久久精品午夜福利| 最新91在线视频| 亚洲免费观看视频| 久久国产视频网| 88av.com| 国产精品一区在线播放| 高跟丝袜一区二区三区| 18国产免费视频| 蜜臀视频一区二区三区| 91在线短视频| 黑人狂躁日本妞一区二区三区| 国产超碰人人爽人人做人人爱| 中文综合在线观看| 成人网在线免费视频| 色综合久久五月| 亚洲xxx自由成熟| 亚洲国产sm捆绑调教视频| 欧美三级免费看| 国内精品一区二区| 欧美日韩一区二区三区视频| 亚洲国产精品久久久久久久| 欧美日韩色视频| 国产精品igao| 日韩av片免费在线观看| 国产成人免费在线| 97人妻精品一区二区三区免| 国产高清在线精品一区二区三区| 欧美精品久久久久久久多人混战 | 日韩欧美亚洲日产国| 欧美丰满少妇xxxx| 日韩激情视频在线| 91精品国产麻豆国产自产在线 | 国产ts人妖一区二区| www.天天射.com| 欧美综合在线观看| 亚洲日本在线天堂| 国产91免费看| 久久综合伊人77777麻豆最新章节| 91精品黄色| 亚洲精品一区二区三区蜜桃下载| 高清不卡在线观看| 久久久久久久久黄色| 国产1区2区在线| 波霸ol色综合久久| 国产电影一区在线| 国产又黄又爽又色| 久久久久国产免费| 国产精品88久久久久久妇女| 国产不卡在线观看| 婷婷丁香激情综合| 亚洲第一色网站| 亚洲理论片在线观看| 日本毛片在线免费观看| 国产日韩欧美自拍| 日韩欧美精品中文字幕| 中文字幕+乱码+中文字幕明步| 丰满人妻一区二区三区大胸| 在线a欧美视频| 91官网在线免费观看| 欧美视频二区36p| 亚洲青青青在线视频| 国产亚洲精久久久久久| 国产二区国产一区在线观看| 日韩专区中文字幕一区二区| 四虎精品一区二区三区| 成人免费区一区二区三区| 欧类av怡春院| 日本人视频jizz页码69| 91成人免费视频| 欧美激情xxxxx| 国产精品护士白丝一区av| 日本精品久久久久| 亚洲视频免费播放| 亚洲三级在线观看视频| 欧美三级午夜理伦三级| 黄色www在线观看| 日本亚洲欧美三级|