華為公布AI模型運行新專利：優化數據預取降低延時

IP屬地中國·北京 編輯：顧雨柔手機中國 時間：2025-09-05 20:11:54

9月5日，天眼查App信息顯示，華為技術有限公司申請的“AI模型的運行方法、裝置、程序產品和存儲介質”專利已正式公布。該專利于當日公開，旨在優化人工智能模型在異構計算環境下的運行效率，減少因數據搬運導致的處理延遲。
根據專利摘要，該技術屬于機器學習領域，主要應用于包含處理器與計算卡協同工作的主機系統。在AI模型訓練或推理過程中，輸入數據通常分批處理。當系統處理第二組數據時，若其包含前一批數據中未出現的新數據，傳統架構需臨時從主機內存調取相關嵌入向量（Embedding Vector），易造成計算卡等待，影響整體效率。
華為此次公布的方案提出了一種前瞻性的數據預取機制。具體而言，主機的處理器會先分析相鄰兩組輸入數據的差異，識別出在第二數據組中出現但未存在于第一數據組中的“第一數據”。隨后，系統提前將這部分新增數據對應的嵌入向量預取至處理器本地的第一內存，并生成相應的向量信息。
關鍵在于，在計算卡處理第二組數據的同時，系統可根據預生成的向量信息，將所需嵌入向量從主機端的第一內存快速預取至計算卡自帶的第二內存中。這一操作實現了數據搬運與計算過程的并行化，有效避免了計算資源的空閑等待，從而顯著降低整體處理延時。

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

阿里千問緊急辟謠

力積存儲再度遞表沖擊港股IPO：近年累虧超5億元，利基DRAM布局下仍面臨多重挑戰

一加中國區總裁李杰：Turbo系列擁有“超巨量的電池”

華為云零售峰會2025：Data+AI雙引擎實效落地，共筑智能時代新零售

安卓上線“擴展深色主題”設置，專治堅守淺色UI的“不聽話”App

國產GPU四小龍IPO齊活！最后一個剛剛公布

全站最新

阿里千問緊急辟謠

力積存儲再度遞表沖擊港股IPO：近年累虧超5億元，利基DRAM布局下仍面臨多重挑戰

一加中國區總裁李杰：Turbo系列擁有“超巨量的電池”

華為云零售峰會2025：Data+AI雙引擎實效落地，共筑智能時代新零售

熱門推薦

阿里千問緊急辟謠

力積存儲再度遞表沖擊港股IPO：近年累虧超5億元，利基DRAM布局下仍面臨多重挑戰

一加中國區總裁李杰：Turbo系列擁有“超巨量的電池”

華為云零售峰會2025：Data+AI雙引擎實效落地，共筑智能時代新零售

安卓上線“擴展深色主題”設置，專治堅守淺色UI的“不聽話”App

國產GPU四小龍IPO齊活！最后一個剛剛公布

蚌埠滕湖機場完成驗證試飛！

中國新礦物團隊再添一員！“金秀礦”正式命名背后有多難？｜封面專訪

羅永浩吐槽后，上海電信：WIFI速率不達標原因很多

李禮輝：必須加快制度創新，確定金融智能體的法律地位

TikTok美國迎“大結局”：持股19.9%合資方案對TikTok意味著什么？

紫光國微：在商業航天領域，公司的FPGA等系列產品正陸續導入

上海電信回應“WIFI速率不達標”

TikTok內部信“泄密”：被反復討論的“美國協議”，到底發生了什么？

我國科學家實現新一代光計算芯片研究新突破

首頁

資訊

財經號

智能車

專題

電商資訊

人物資訊

滾動資訊

首頁

新科技

新金融

新零售

智能車

房地產

科技探索

人物資訊

網絡游戲

人工智能

華為公布AI模型運行新專利：優化數據預取降低延時

首頁

資訊

財經號

智能車

專題

電商資訊

人物資訊

滾動資訊

華為公布AI模型運行新專利：優化數據預取 降低延時

同類資訊

華為公布AI模型運行新專利：優化數據預取降低延時