亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

CPU 反超 NPU:LLM 端側部署新范式 T-MAC 開源,llama.cpp 生成速度翻 5 倍

IP屬地 中國·北京 編輯:鄭浩 IT之家 時間:2024-08-14 08:23:37

T-MAC 是一種創新的基于查找表(LUT)的方法,專為在 CPU 上高效執行低比特大型語言模型(LLMs)推理而設計,無需權重反量化,支持混合精度矩陣乘法(mpGEMM),顯著降低了推理開銷并提升了計算速度。

為增強設備上的智能性,在邊緣設備部署大型語言模型(LLMs)成為了一個趨勢,比如微軟的 Windows 11 AI + PC。

目前部署的大語言模型多會量化到低比特。然而,低比特 LLMs 在推理過程中需要進行低精度權重和高精度激活向量的混合精度矩陣乘法(mpGEMM)。現有的系統由于硬件缺乏對 mpGEMM 的原生支持,不得不將權重反量化以進行高精度計算。這種間接的方式導致了顯著的推理開銷,并且無法隨著比特數進一步降低而獲得加速。

為此,微軟亞洲研究院、中國科學技術大學、中國科學院大學的研究人員聯合開發了 T-MAC。T-MAC 采用基于查找表(LUT)的計算范式,無需反量化,直接支持混合精度矩陣乘,其高效的推理性能以及其統一且可擴展的特性為在資源受限的邊緣設備上實際部署低比特 LLMs 鋪平了道路。

代碼: https://github.com/microsoft / T-MAC 論文: https://www.arxiv.org/pdf/2407.00088

此外,當前大模型的部署普遍依賴于專用加速器,如 NPU 和 GPU 等,而 T-MAC 可以擺脫專用加速器的依賴,僅利用 CPU 部署 LLMs,推理速度甚至能夠超過同一片上的專用加速器,使 LLMs 可以部署在各類包括 PC、手機、樹莓派等邊緣端設備。T-MAC 現已開源。

在 CPU 上高效部署低比特大語言模型

T-MAC 的關鍵創新在于采用基于查找表(LUT)的計算范式,而非傳統的乘累加(MAC)計算范式。T-MAC 利用查找表直接支持低比特計算,從而消除了其他系統中必須的反量化 (dequantization) 操作,并且顯著減少了乘法和加法操作的數量。

經過實驗,T-MAC 展現出了卓越的性能:在配備了最新高通 Snapdragon X Elite 芯片組的 Surface AI PC 上,3B BitNet-b1.58 模型的生成速率可達每秒 48 個 token,2bit 7B llama 模型的生成速率可達每秒 30 個 token,4bit 7B llama 模型的生成速率可達每秒 20 個 token。

這甚至超越了 NPU 的性能!

當部署 llama-2-7b-4bit 模型時,盡管使用 NPU 可以生成每秒 10.4 個 token,但 CPU 在 T-MAC 的助力下,僅使用兩核便能達到每秒 12.6 個 token,最高甚至可以飆升至每秒 22 個 token。

這些都遠超人類的平均閱讀速度,相比于原始的 llama.cpp框架提升了 4 至 5 倍。

即使在較低端的設備如 Raspberry Pi 5 上,T-MAC 針對 3B BitNet-b1.58 也能達到每秒 11 個 token 的生成速率。T-MAC 也具有顯著的功耗優勢:達到相同的生成速率,T-MAC 所需的核心數僅為原始 llama.cpp的 1/4 至 1/6,降低能耗的同時也為其它應用留下計算資源。

值得注意的是,T-MAC 的計算性能會隨著比特數的降低而線性提高,這一現象在基于反量化去實現的 GPU 和 NPU 中是難以觀察到的。但 T-MAC 能夠在 2 比特下實現單核每秒 10 個 token,四核每秒 28 個 token,大大超越了 NPU 的性能。

圖 1 BitNet on T-MAC vs llama.cppon Apple M2

圖 2 在不同端側設備 CPU(Surface Laptop 7, NVIDIA AGX Orin, Apple M2-Ultra)的各核數下 T-MAC 和 llama.cpp的 token 生成速度可達 llama.cpp的 4-5 倍。達到相同的生成速率,T-MAC 所需的核心數僅為原始 llama.cpp的 1/4 至 1/6 矩陣乘不需乘,只需查表 (LUT)

對于低比特參數 (weights),T-MAC 將每一個比特單獨進行分組(例如,一組 4 個比特),這些比特與激活向量相乘,預先計算所有可能的部分和,然后使用 LUT 進行存儲。

之后,T-MAC 采用移位和累加操作來支持從 1 到 4 的可擴展位數。通過這種方法,T-MAC 拋棄了 CPU 上效率不高的 FMA(乘加)指令,轉而使用功耗更低效率也更高的 TBL / PSHUF(查表)指令。

圖 3 混合精度 GEMV 基于現有反量化的實現范式 vs T-MAC 基于查找表的新范式 以比特為核心的計算,取代以數據類型為核心的計算

傳統的基于反量化的計算,實際上是以數據類型為核心的計算,這種方式需要對每一種不同的數據類型單獨定制。

每種激活和權重的位寬組合,如 W4A16(權重 int4 激活 float16)和 W2A8,都需要特定的權重布局和計算內核。

舉個例子,W3 的布局需要將 2 位和另外 1 位分開打包,并利用不同的交錯或混洗方法進行內存對齊或快速解碼。然后,相應的計算內核需要將這種特定布局解包到硬件支持的數據類型進行執行。

而 T-MAC 通過從比特的視角觀察低比特矩陣乘計算,只需為單獨的一個比特設計最優的數據結構,然后通過堆疊的方式擴展到更高的 2/3/4 比特。

同時,對于不同精度的激活向量(float16 / float32 / int8),僅有構建表的過程需要發生變化,在查表的時候不再需要考慮不同的數據結構。

圖 4以比特為核心的查表計算混合精度 GEMV

同時,傳統基于反量化的方法,從 4-比特降低到 3/2/1-比特時,盡管內存占用更少,但是計算量并未減小,而且由于反量化的開銷不減反增,性能反而可能會更差。

但 T-MAC 的計算量隨著比特數降低能夠線性減少,從而在更低比特帶來更好加速,為最新的工作 BitNet,EfficientQAT 等發布的 1-比特 / 2-比特模型提供了高效率的部署方案。

圖 5 使用不同端側設備 CPU 的單核,T-MAC 在 4 到 1 比特的混合精度 GEMV 算子相較 llama.cpp加速 3-11 倍。T-MAC 的 GEMM 耗時能隨著比特數減少線性減少,而基于反量化的 llama.cpp無法做到(1 比特 llama.cpp的算子性能由其 2 比特實現推算得到) 高度優化的算子實現

基于比特為核心的計算具有許多優勢,但將其實現在 CPU 上仍具有不小的挑戰:

(1)與激活和權重的連續數據訪問相比,表的訪問是隨機的。表在快速片上內存中的駐留對于最終的推理性能尤為重要; (2)然而,片上內存是有限的,查找表(LUT)方法相比傳統的 mpGEMV 增大了片上內存的使用。這是因為查找表需要保存激活向量與所有可能的位模式相乘的結果。這比激活本身要多得多。

圖 6 T-MAC 與 llama.cpp在計算數據流上的不同

為此,微軟亞洲研究院的研究員們深入探究了基于查表的計算數據流,為這種計算范式設計了高效的數據結構和計算流程,其中包括:

1. 將 LUT 存入片上內存,以利用 CPU 上的查表向量指令(TBL / PSHUF)提升隨機訪存性能。

2. 改變矩陣 axis 計算順序,以盡可能提升放入片上內存的有限 LUT 的數據重用率。

3. 為查表單獨設計最優矩陣分塊(Tiling)方式,結合 autotvm 搜索最優分塊參數

4. 參數 weights 的布局優化

a)weights 重排,以盡可能連續訪問并提升緩存命中率 b)weights 交錯,以提升解碼效率

5.對 Intel / ARM CPU 做針對性優化,包括

a)寄存器重排以快速建立查找表 b)通過取平均數指令做快速 8-比特累加

研究員們在一個基礎實現上,一步步應用各種優化,最終相對于 SOTA 低比特算子獲得顯著加速:

圖 7:在實現各種優化后,T-MAC 4-比特算子最終相對于 llama.cpp獲得顯著加速

廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節省甄選時間,結果僅供參考,所有文章均包含本聲明。

免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

狠狠爱在线视频一区| 国产一区不卡在线| 亚洲国产日韩欧美在线99| 久久久久久久久久久视频| 日本视频在线一区| 国产伦精品一区二区三区视频孕妇| 中文字幕1区2区3区| 97在线视频观看| 中文字幕有码无码人妻av蜜桃| 欧美成人黑人xx视频免费观看| 久久狠狠高潮亚洲精品| 欧美成年人网站| 亚洲最大成人在线视频| 国产精品三级在线| 日韩在线观看一区二区| 欧美日韩一区二区视频在线观看| 国产suv精品一区二区6| 青草网在线观看| 精品久久久香蕉免费精品视频| 2018国产精品| 神马久久桃色视频| 五月婷婷中文字幕| 91丨九色丨国产| 久久亚洲综合av| 扒开伸进免费视频| 中文字幕日韩综合av| 99热这里只有精品3| 亚洲成人在线视频网站| 日韩欧美国产中文字幕| www.av视频在线观看| 国产欧美一区二区三区四区| 不卡电影一区二区三区| 国产亚洲精品成人a| 久久夜精品香蕉| 高清久久久久久| 丰满少妇一区二区三区| 国产91在线播放九色快色| 成人激情免费电影网址| 91精品人妻一区二区| 国产精品亚洲一区二区三区| 国产日韩精品视频一区| 貂蝉被到爽流白浆在线观看| 国产欧美最新羞羞视频在线观看| 亚洲欧美一区二区三区极速播放| 成年人免费视频播放| 激情视频在线观看一区二区三区| 亚洲国产一区二区在线播放| 日本a级c片免费看三区| 亚洲午夜精品一区二区三区| 亚洲精品v欧美精品v日韩精品 | 精品国产av 无码一区二区三区 | 亚洲国产精品18久久久久久| 国产日韩一区二区在线观看| 隔壁老王国产在线精品| 亚洲一区在线播放| 无码人妻一区二区三区免费| www.日本三级| 2018国产精品视频| 精品日韩中文字幕| 亚洲av电影一区| 国产吞精囗交久久久| 日韩欧美亚洲区| 亚洲人成绝费网站色www| 成人一区二区在线观看| 欧美日韩一级在线观看| 97超碰人人澡| 91久久精品国产91久久| 日韩欧美视频在线| 波多野结衣三级视频| 国产成a人亚洲精v品在线观看| 亚洲欧美在线x视频| 国产午夜精品一区二区三区嫩草 | 欧美日韩一区二区三区免费看| 色综合免费视频| 国产又粗又猛又爽又黄的视频小说| 涩涩涩999| 欧美高清性猛交| 欧美日韩卡一卡二| 90岁老太婆乱淫| 欧美岛国在线观看| 中文一区在线播放| 日韩中文字幕免费观看| 欧美福利在线视频| 国产主播中文字幕| 精选一区二区三区四区五区| 欧美精品在线免费| 4438亚洲最大| 午夜免费久久看| 亚洲国产激情av| 不卡的看片网站| 青青草一区二区三区| 五月婷婷激情五月| 中国毛片直接看| 韩国女同性做爰三级| 可以看的av网址| 在线免费观看av的网站| 大陆极品少妇内射aaaaaa| 九9re精品视频在线观看re6| 26uuu另类亚洲欧美日本一| 中文字幕久久亚洲| 欧美精品一区二区三区高清aⅴ | 欧美精品在欧美一区二区少妇| 国产精品久久毛片av大全日韩| 高清不卡一区二区在线| 床上的激情91.| av福利精品导航| 国产乱一区二区| 韩国三级电影一区二区| 精品影院一区二区久久久| 久久99精品久久只有精品| 日本91福利区| www.久久久久久久久| 国产69精品久久99不卡| 丰满少妇久久久久久久| 成人在线视频一区| 国产成人精品影视| 国产精品一区二区久久不卡 | 国产麻豆欧美日韩一区| www国产成人免费观看视频 深夜成人网| 豆国产96在线|亚洲| 久久久久久**毛片大全| 国产精品久久久久永久免费观看| 国产日韩欧美综合在线| 伊人一区二区三区| 精品视频资源站| 欧美三级蜜桃2在线观看| 亚洲成人1区2区| 欧美日免费三级在线| 精品久久久久香蕉网| 综合网中文字幕| 91av在线国产| 日韩伦理一区二区三区av在线| 粉嫩av免费一区二区三区| 日本精品一区二区三区视频 | 欧美三级电影在线播放| 鲁一鲁一鲁一鲁一澡| 天堂av8在线| 清纯粉嫩极品夜夜嗨av| 国产福利小视频| 99久久精品国产观看| 国产成人av电影| 亚洲精品国产精华液| 日韩网站在线看片你懂的| 午夜精品久久久久久久99热浪潮| 欧美在线视频在线播放完整版免费观看 | 日韩av网站在线| 国产91在线高潮白浆在线观看| 国精产品99永久一区一区| 男人天堂av片| 一区二区三区影视| 国产又粗又长又大视频| 国模私拍视频在线| 亚洲成国产人片在线观看| 国产香蕉精品视频一区二区三区 | 欧美日韩精品在线视频| 欧美日本精品在线| 女人帮男人橹视频播放| 51妺嘿嘿午夜福利| 日本不卡视频在线观看| 懂色av影视一区二区三区| 色av吧综合网| 99久久精品久久久久久ai换脸| 男女污污的视频| 亚洲熟女乱色一区二区三区久久久| 99国产精品99久久久久久| 亚洲天堂免费在线| 欧美精品亚洲| 日韩在线中文字幕视频| a级高清视频欧美日韩| 日韩欧美在线一区二区三区| 国产精品一区二区三区不卡 | 国产传媒免费在线观看| 大陆成人av片| 日韩视频亚洲视频| 国产 日韩 欧美在线| 蜜桃av免费观看| 国产精品欧美精品| 国产精品美女久久久久久免费| 中文字幕12页| 十八禁一区二区三区| 亚洲h精品动漫在线观看| 欧美精品成人在线| 永久av免费在线观看| 国产中文一区二区三区| 色偷偷偷亚洲综合网另类| 五月婷婷六月合| 国产一区二区三区四区在线观看 | 国产精品美女av| 日韩激情一区二区三区| 欧美视频专区一二在线观看| 欧美精品一区二区三区久久| 欧美男人亚洲天堂| 欧美一级免费观看| 中文字幕黄色大片| 香蕉av在线播放| 美乳少妇欧美精品| 精品人妻一区二区三区香蕉| 亚洲免费大片在线观看| 国产va免费精品高清在线| 污污的视频免费观看| 国产精品久久久久久久久免费丝袜| 日韩av电影免费观看高清| 免费中文字幕在线| 在线日韩国产精品| 妞干网这里只有精品| 国产精品一二三四五| 国产精品久久网| 国产av无码专区亚洲av麻豆| 久久精品视频播放| 日韩在线免费观看av| 欧美成人一区二区三区在线观看| 成年人小视频网站| 亚洲国产成人一区二区三区| 欧美综合激情| 不卡一区二区中文字幕| 国产精品自产拍在线观| 成人精品在线看| 亚洲色图美腿丝袜| 日本一二三区不卡| xxxxx成人.com| 影音先锋国产资源| 午夜精品一区二区三区av| 亚洲天堂网在线观看视频| 欧美国产日本在线| 女尊高h男高潮呻吟| 欧美性猛交xxxx黑人| 国产人妻一区二区| 欧美高清精品3d| 午夜偷拍福利视频| 色偷偷av亚洲男人的天堂| 国产女人18毛片水真多| 国产免费亚洲高清| 国产一区二区三区在线观看免费视频| 亚洲在线观看一区| 亚洲午夜视频在线| 性欧美13一14内谢| 欧美理论电影在线播放| 久久久噜噜噜| 老汉色影院首页| 五月天国产精品| 国产成人无码精品久久二区三| 中文日韩在线视频| 日日摸夜夜添夜夜添亚洲女人| 神马影院午夜我不卡影院| 一区二区三区在线播放| 亚洲精品国产精品国自| 久久亚洲国产精品成人av秋霞| 亚洲国产精品久久人人爱潘金莲| 一本久道久久综合| 亚洲一区二区三区四区在线观看 | 国产精品我不卡| 亚洲精品国产一区二区三区四区在线| 韩国黄色一级片| 26uuu日韩精品一区二区| av资源站一区| 69xxx免费| 91九色单男在线观看| 一区二区三区在线免费观看| 麻豆视频在线观看| 国产破处视频在线观看| 好男人www在线视频| 日韩第一页在线观看| 91精品办公室少妇高潮对白| 成人精品在线看| 国产在线视频综合| 国产网站欧美日韩免费精品在线观看 | 怡红院av亚洲一区二区三区h| 在线观看日韩视频| 国产成人免费视频精品含羞草妖精| 91日韩精品视频| 欧美激情中文字幕在线| 亚洲丝袜另类动漫二区| 国产在线观看第一页| 欧美理论一区二区| 国产一区二区精品丝袜| 国产精品18久久久久久久久久久久| 99久久免费看精品国产一区 | 亚洲第一页在线视频| 在线免费观看一区| 日韩不卡在线观看日韩不卡视频| 黄色性视频网站| 日韩av大片在线| 亚洲高清福利视频| 国产人成一区二区三区影院| 国产jzjzjz丝袜老师水多| 日b视频在线观看| 伊人久久大香线蕉av一区| 高清欧美电影在线| 亚洲女与黑人做爰| 午夜精品久久久久久久99老熟妇| 国产精品久久久免费观看| 天堂一区二区三区| 日韩av电影在线免费播放| 91麻豆精品国产自产在线观看一区| 久久99国产精品久久99果冻传媒| 亚洲最新免费视频| 国内久久久精品| 欧美电影一区二区三区| 2023国产精品| 日韩av不卡一区二区| 亚洲另类欧美日韩| 无码国产69精品久久久久同性| 无码毛片aaa在线| 成人久久久久爱| 91精品国产九九九久久久亚洲| 欧美变态tickle挠乳网站| 亚洲美女在线国产| 国产成人日日夜夜| 亚洲AV无码成人片在线观看| 天堂网一区二区三区| 亚洲а∨天堂久久精品2021| 手机在线国产视频| 午夜免费福利在线| 69堂免费视频| 26uuu成人| 成年人三级视频| 日韩欧美视频一区二区| 久久99精品久久久水蜜桃| 国产综合视频在线观看| 国产精品第100页| 国产精品视频xxxx| 国产精品视频自在线| 亚洲美女又黄又爽在线观看| 亚洲国内精品在线| 亚洲аv电影天堂网| 亚洲精品aⅴ中文字幕乱码| 欧美一级高清片| 欧美mv日韩mv国产网站app| 日韩成人久久久| 亚洲欧美日韩成人| 亚洲性生活视频| 久久中文久久字幕| 午夜精品久久久久久久男人的天堂 | 久久亚洲a v| www.xxx亚洲| 高清av免费看| 中文字幕a在线观看| 日本少妇aaa| 中文字幕在线欧美| 懂色av成人一区二区三区| 丝袜美腿亚洲综合| 99在线视频精品| 高跟丝袜一区二区三区| 精品国偷自产国产一区| 九九视频直播综合网| 国产精品中文在线| 亚洲欧洲日韩综合二区| 999这里有精品| 搜索黄色一级片| 亚洲精品97久久中文字幕无码 | 欧美国产日本高清在线| 岛国一区二区三区高清视频| 亚洲美免无码中文字幕在线| 亚洲女则毛耸耸bbw| 国产吞精囗交久久久| 国产女人高潮时对白| 成人三级伦理片| 欧美日韩国产美女| 不卡毛片在线看| 宅男av一区二区三区| 乱码一区二区三区| 亚洲精品久久久久久久蜜桃| 国产一区二区0| 欧美日韩一本到| 青青在线视频一区二区三区| 久久精品在线免费视频| 中文字幕永久有效| 伊人亚洲综合网| 国产精品成人免费| 欧美精品videossex88| 欧美在线观看黄| 久久99国产综合精品免费| 成人免费va视频| 精品亚洲国产视频| 国产精华一区二区三区| 精品国产aⅴ一区二区三区东京热 久久久久99人妻一区二区三区 | 国产精品私房写真福利视频| 在线精品高清中文字幕| 亚欧精品在线| 国产成人亚洲欧洲在线| 不卡的av电影| 色av中文字幕一区| 黄色www网站| 国产美女主播在线观看| 色综合久久99| 精品国产乱码久久久久久蜜柚| 手机看片福利视频| 92国产精品观看| 精品国产乱码久久久久久图片| 亚洲精品在线91| 黄色网址在线免费看| 一本一道人人妻人人妻αv| 亚洲成人动漫精品| 日韩精品资源| 国产精品第6页| 欧美亚洲国产一卡| 欧美日韩国产高清视频| 亚洲精品1区2区3区| 色婷婷av一区二区三区gif| 日韩av电影免费在线| 这里只有久久精品视频| 欧美日韩综合一区| 国产成人一区二区三区别| av中文字幕免费| 国产亚洲欧美一区| 91精产国品一二三产区别沈先生| 成人毛片在线免费观看| 久久香蕉频线观| 免费看裸体网站| 欧美日韩一区二区在线观看视频|