亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當(dāng)前位置: 首頁 ? 資訊 ? 智能車 ? 正文

邊緣智能的新時(shí)代:端側(cè)大模型的研究進(jìn)展綜述

IP屬地 中國·北京 編輯:陳陽 機(jī)器之心Pro 時(shí)間:2024-09-25 19:47:56
AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收?qǐng)?bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級(jí)實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)交流與傳播。如果您有優(yōu)秀的工作想要分享,歡迎投稿或者聯(lián)系報(bào)道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.comJiajun Xu : meta AI科學(xué)家,專注大模型和智能眼鏡開發(fā)。南加州大學(xué)博士,linkedin Top AI Voice,暢銷書作家。他的AI科普繪本AI for Babies (“寶寶的人工智能”系列,雙語版剛在國內(nèi)出版) 暢銷硅谷,曾獲得亞馬遜兒童軟件、編程新書榜榜首。Zhiyuan Li : Nexa AI CTO,斯坦福校友,前斯坦福CEO協(xié)會(huì)主席, Octopus系列論文作者。他在 Google Labs 和 Amazon Lab126 擁有豐富的端側(cè) AI 模型訓(xùn)練、部署和產(chǎn)品開發(fā)經(jīng)驗(yàn)。Wei Chen : Nexa AI CEO,斯坦福博士,前斯坦福CEO協(xié)會(huì)主席。他深耕人工智能領(lǐng)域,先后發(fā)表多篇Octopus系列模型論文,其中Octopus-V2模型曾在huggingface全球60萬模型中位列第二,并在Google 2024 IO上被feature。Qun Wang : 舊金山州立大學(xué)計(jì)算機(jī)系助理教授,曾在勞倫斯伯克利國家重點(diǎn)實(shí)驗(yàn)室做博后,猶他州立大學(xué)博士。研究方向主要集中在下一代通信網(wǎng)絡(luò)中邊緣計(jì)算的能效和安全優(yōu)化,以及邊緣智能系統(tǒng)的通信和訓(xùn)練加速。先后在IEEE發(fā)布多篇論文。Xin Gao, Qi Cai : 北德州大學(xué)博士生Ziyuan Ling : Nexa AI 初創(chuàng)設(shè)計(jì)師,伯克利設(shè)計(jì)系研究生

1 序言:邊緣智能的新紀(jì)元

在人工智能的飛速發(fā)展中,大型語言模型(LLMs)以其在自然語言處理(NLP)領(lǐng)域的革命性突破,引領(lǐng)著技術(shù)進(jìn)步的新浪潮。自 2017 年 Transformer 架構(gòu)的誕生以來,我們見證了從 OpenAI 的 GPT 系列到 meta 的 LLaMA 系列等一系列模型的崛起,它們不僅在技術(shù)層面上不斷刷新我們對(duì)機(jī)器理解與生成人類語言能力的認(rèn)知,更在實(shí)際應(yīng)用中展現(xiàn)出巨大的潛力和價(jià)值。

然而,這些模型傳統(tǒng)上主要部署在云端服務(wù)器上,這種做法雖然保證了強(qiáng)大的計(jì)算力支持,卻也帶來了一系列挑戰(zhàn):網(wǎng)絡(luò)延遲、數(shù)據(jù)安全、持續(xù)的聯(lián)網(wǎng)要求等。這些問題在一定程度上限制了 LLMs 的廣泛應(yīng)用和用戶的即時(shí)體驗(yàn)。正因如此,將 LLMs 部署在端側(cè)設(shè)備上的探索應(yīng)運(yùn)而生,它不僅能夠提供更快的響應(yīng)速度,還能在保護(hù)用戶隱私的同時(shí),實(shí)現(xiàn)個(gè)性化的用戶體驗(yàn)。

隨著技術(shù)的不斷進(jìn)步,邊緣 AI 市場的全球規(guī)模正以驚人的速度增長。預(yù)計(jì)從 2022 年的 152 億美元增長到 2032 年的 1436 億美元,這一近十倍的增長不僅反映了市場對(duì)邊緣 AI 解決方案的迫切需求,也預(yù)示著在制造、汽車、消費(fèi)品等多個(gè)行業(yè)中,邊緣 AI 技術(shù)將發(fā)揮越來越重要的作用。

圖 1:2022 年至 2032 年按終端用戶劃分的端側(cè) AI 全球市場規(guī)模(單位:十億美元)。

在這樣的背景下,本綜述文章深入探討了在邊緣設(shè)備上部署 LLM 的策略和進(jìn)展。我們將詳細(xì)分析模型壓縮技術(shù)、能效計(jì)算策略以及輕量級(jí)模型架構(gòu)的創(chuàng)新設(shè)計(jì)。此外,文章還將討論硬件加速策略、邊緣 - 云協(xié)同部署方法,并重點(diǎn)介紹在邊緣場景中有效利用 LLM 的部署策略,以及這些技術(shù)在行業(yè)中的應(yīng)用實(shí)例和帶來的益處。

論文標(biāo)題:On-Device Language Models: A Comprehensive Review論文鏈接:https://arxiv.org/abs/2409.00088相關(guān)鏈接:LLMsOnDevice.com

通過本綜述,我們希望為讀者提供一份關(guān)于如何在端側(cè)設(shè)備上部署和優(yōu)化 LLMs 的全面指南,同時(shí)指出當(dāng)前研究的方向和面臨的挑戰(zhàn),為未來的技術(shù)發(fā)展提供參考和啟示。我們相信,通過跨學(xué)科的共同努力,我們能夠?qū)崿F(xiàn)智能計(jì)算的普及。

圖 2:本篇綜述結(jié)構(gòu)

2 技術(shù)進(jìn)展:探索端側(cè) LLMs 部署

在人工智能的浪潮中,端側(cè)大型語言模型(On-Device LLMs)正以其迅猛的發(fā)展速度和廣泛的應(yīng)用前景,成為技術(shù)革新的新寵。自 2023 年起,隨著參數(shù)量低于 10B 的模型系列如 meta 的 LLaMA、Microsoft 的 Phi 系列等的涌現(xiàn),我們見證了 LLMs 在邊緣設(shè)備上運(yùn)行的可行性和重要性。這些模型不僅在性能上取得了長足的進(jìn)步,更通過混合專家、量化和壓縮等技術(shù),保持了參數(shù)量的優(yōu)化,為邊緣設(shè)備的多樣化應(yīng)用場景提供了強(qiáng)大支持。

進(jìn)入 2024 年,新模型的推出愈發(fā)密集,如圖 3 所示,Nexa AI 的 Octopus 系列、Google 的 Gemma 系列等,它們不僅在文本處理上有所增強(qiáng),更在多模態(tài)能力上展現(xiàn)了新的可能性,如結(jié)合文本與圖像等多模態(tài)輸入,以適應(yīng)更復(fù)雜的用戶交互需求。

圖 3:on-device LLM 的演進(jìn),展示了自 2023 年以來的重要模型和發(fā)展里程碑。

然而,要在資源受限的設(shè)備上部署這些強(qiáng)大的模型,我們必須面對(duì)內(nèi)存和計(jì)算能力的雙重挑戰(zhàn)。研究者們通過量化感知縮放、稀疏更新等創(chuàng)新方法,有效解決了這些問題,使得大型模型即便在參數(shù)量巨大的情況下,也能在設(shè)備端高效運(yùn)行。

相較于完全依賴云端的 LLM 服務(wù),端側(cè)推理的優(yōu)勢顯而易見。它不僅減少了數(shù)據(jù)傳輸?shù)难舆t,更保護(hù)了用戶數(shù)據(jù)的隱私安全。圖 4 的投票分布顯示,大多數(shù)參與者更傾向于邊緣云協(xié)作的架構(gòu),對(duì)現(xiàn)有僅云端的解決方案并不滿意。端側(cè)推理的低延遲特性,尤其適用于需要實(shí)時(shí)響應(yīng)的應(yīng)用場景,如 Google 的 Gemini Nano 支持的 TalkBack 功能,即便在完全離線的情況下也能正常工作。

圖 4:用戶對(duì)不同 LLM 部署方式的偏好情況

衡量端側(cè) LLMs 性能的指標(biāo)包括延遲、推理速度、內(nèi)存消耗等。這些指標(biāo)直接關(guān)系到模型在邊緣設(shè)備上的實(shí)際運(yùn)行效果,以及用戶的使用體驗(yàn)。隨著技術(shù)的不斷成熟,我們期待這些性能指標(biāo)能得到進(jìn)一步的優(yōu)化,使得端側(cè)大語言模型能在更多場景下發(fā)揮其潛力。

3 架構(gòu)創(chuàng)新:優(yōu)化邊緣設(shè)備的性能

在智能手機(jī)和邊緣設(shè)備上部署大型語言模型(LLMs)正成為人工智能領(lǐng)域的新挑戰(zhàn)。面對(duì)有限的內(nèi)存和計(jì)算能力,研究者們提出了一系列創(chuàng)新的架構(gòu)設(shè)計(jì)原則和方法,旨在實(shí)現(xiàn)資源的高效利用和性能的最大化。架構(gòu)創(chuàng)新變得尤為關(guān)鍵,其中包括參數(shù)共享、模塊化設(shè)計(jì)以及緊湊的表示形式。例如,MobileLLM 通過深度和瘦長的模型結(jié)構(gòu)優(yōu)化了參數(shù)量在十億以下的模型,而 EdgeShard 框架則通過邊緣云協(xié)作計(jì)算實(shí)現(xiàn)了模型的分布式處理,顯著降低了延遲并提高了吞吐量。

同時(shí),模型壓縮與參數(shù)共享技術(shù)的應(yīng)用,如 AWQ 方法和 MobileLLM,不僅減少了模型尺寸,還在保持性能的同時(shí)加快了推理速度。這些技術(shù)通過保護(hù)關(guān)鍵權(quán)重和優(yōu)化模型結(jié)構(gòu),為 LLMs 在端側(cè)的部署提供了新的可能性。協(xié)作和層次化模型方法通過分散計(jì)算負(fù)載和利用不同能力模型的組合,解決了資源受限設(shè)備的部署難題。EdgeShard 和 LLMCad 的研究成果展示了這種方法的有效性,它們通過在多個(gè)設(shè)備上分配計(jì)算任務(wù),提升了 LLMs 的可擴(kuò)展性和效率。

在內(nèi)存和計(jì)算效率的優(yōu)化方面,Samsung Electronics 提出的 PIM 和 PNM 技術(shù),以及 MELT 基礎(chǔ)設(shè)施,都顯著提升了內(nèi)存帶寬和容量,同時(shí)降低了能耗,為 LLMs 的移動(dòng)部署鋪平了道路。MoE 架構(gòu)的應(yīng)用,如 EdgeMoE 和 LocMoE,通過稀疏激活和動(dòng)態(tài)路由,進(jìn)一步提高了 LLMs 的效率。這些方法通過優(yōu)化專家網(wǎng)絡(luò)的選擇和路由,減少了模型的內(nèi)存占用和提高了計(jì)算速度。

此外,總體效率和性能提升的研究,如 Any-Precision LLM 和 LCDA 框架,通過提供多精度支持和軟硬件協(xié)同設(shè)計(jì),為 LLMs 在邊緣設(shè)備上的高效運(yùn)行提供了新的視角。隨著這些創(chuàng)新技術(shù)的迅速發(fā)展,我們期待在移動(dòng)設(shè)備和邊緣設(shè)備上享受到與云端相媲美的智能體驗(yàn),這將為用戶帶來更加快速、個(gè)性化的服務(wù),同時(shí)確保數(shù)據(jù)的安全性和隱私保護(hù)。智能邊緣計(jì)算的未來正變得愈發(fā)清晰,它將為人工智能領(lǐng)域帶來深遠(yuǎn)的影響和無限的可能性。

4 模型壓縮:平衡性能與效率

在邊緣設(shè)備上部署大型語言模型(LLMs)時(shí),保持性能的同時(shí)提升計(jì)算效率尤為關(guān)鍵。本文綜述了四種關(guān)鍵的模型壓縮技術(shù):量化、剪枝、知識(shí)蒸餾和低秩分解,這些方法通過在性能、內(nèi)存占用和推理速度之間找到平衡,確保了 LLMs 在端側(cè)應(yīng)用的可行性。

量化是一種通過降低模型權(quán)重和激活的精度來減少模型大小的技術(shù)。這種方法能夠在幾乎不損失模型性能的情況下,顯著減少模型所需的存儲(chǔ)空間和計(jì)算資源。后訓(xùn)練量化(PTQ)是一種在模型訓(xùn)練完成后應(yīng)用的技術(shù),它通過一些先進(jìn)的補(bǔ)償策略,如 GPTQ,可以在將模型權(quán)重量化到 3 或 4 位的情況下,保持模型的高準(zhǔn)確度。而量化感知訓(xùn)練(QAT)則將量化集成到模型的訓(xùn)練過程中,使模型在訓(xùn)練時(shí)就適應(yīng)低精度的約束,從而在量化后保持更高的準(zhǔn)確度。

剪枝是另一種通過減少模型復(fù)雜性來提升計(jì)算效率的方法。結(jié)構(gòu)化剪枝通過移除模型中的整個(gè)參數(shù)子集,如層、通道或過濾器,來優(yōu)化硬件性能。無結(jié)構(gòu)化剪枝則在更細(xì)的粒度上工作,移除單個(gè)權(quán)重,提供更高的壓縮率。此外,上下文剪枝根據(jù)模型的運(yùn)行上下文動(dòng)態(tài)地移除權(quán)重,確保在不同條件下都能保持最優(yōu)的性能。

知識(shí)蒸餾是一種將大型模型的知識(shí)遷移到小型模型的技術(shù)。黑盒 KD 只使用教師模型的輸出進(jìn)行學(xué)習(xí),而白盒 KD 則允許學(xué)生模型訪問教師模型的內(nèi)部狀態(tài),實(shí)現(xiàn)更深入的學(xué)習(xí)。這種方法可以在不犧牲性能的情況下,顯著減少模型的大小和計(jì)算需求。

低秩分解是一種將大型矩陣分解為較小矩陣的技術(shù)。這種方法利用了矩陣的低秩結(jié)構(gòu),減少了計(jì)算復(fù)雜性,同時(shí)保持了模型的準(zhǔn)確性。Yao 等人的研究將 LRF 與 PTQ 結(jié)合,提出了低秩補(bǔ)償(LoRC),在顯著減少模型大小的同時(shí),通過補(bǔ)償策略保持了模型的準(zhǔn)確性。

5 硬件加速:推動(dòng)端側(cè) LLMs 的高效運(yùn)行

硬件加速器在大型語言模型(LLMs)的端側(cè)部署中扮演著至關(guān)重要的角色。GPU 和 TPU 等專用硬件提供了強(qiáng)大的計(jì)算能力和高內(nèi)存帶寬,它們是訓(xùn)練和加速 LLMs 的重要基礎(chǔ)。NVIDIA 的 Tensor Cores 以及 Google TPU 的高效矩陣乘法能力,都為基于 Transformer 的模型提供了強(qiáng)有力的支持。同時(shí),F(xiàn)PGA 以其靈活性,通過稀疏矩陣乘法和量化技術(shù),在 Transformer 層的推理任務(wù)中展現(xiàn)出高效能,為特定模型架構(gòu)提供了定制優(yōu)化的可能。

軟硬件協(xié)同設(shè)計(jì)的方法,如量化感知訓(xùn)練和模型壓縮,進(jìn)一步提升了 LLMs 的效率,使得它們能夠跨越從高功率服務(wù)器到低功率邊緣設(shè)備的廣泛部署。這些技術(shù)通過參數(shù)共享和先進(jìn)的內(nèi)存管理,減少了模型的存儲(chǔ)需求,確保了快速且成本效益更高的部署。此外,各種框架如 Llama.cpp、MNN、PowerInfer 等,根據(jù)不同的硬件平臺(tái)和用例需求,提供了優(yōu)化的部署策略,從而實(shí)現(xiàn)從云端到邊緣的無縫協(xié)作。

在邊緣云部署方面,MLC-LLM 和 VLLM 等技術(shù)通過支持高效的量化方法和關(guān)鍵內(nèi)存管理,優(yōu)化了 LLMs 在邊緣設(shè)備和云環(huán)境中的部署。OpenLLM 等項(xiàng)目通過 BentoML 等工具,實(shí)現(xiàn)了開源 LLMs 的快速部署,提供了與 OpenAI 兼容的 API 服務(wù)。隨著硬件技術(shù)的不斷進(jìn)步,如 NVIDIA A100 GPU 和 Google TPU v4,我們看到了端側(cè) LLMs 性能的顯著提升,這些硬件不僅提供了巨大的計(jì)算能力,還通過混合精度訓(xùn)練等技術(shù),大幅減少了模型的內(nèi)存占用并提高了計(jì)算效率。

6 實(shí)例與應(yīng)用:端側(cè) LLMs 的實(shí)踐探索

端側(cè)語言模型的實(shí)例:Gemini Nano 模型通過 Google AI Edge SDK 為移動(dòng)操作系統(tǒng)提供了一個(gè)小型但功能強(qiáng)大的 LLM,它通過 4 位量化部署,提供了一流的性能和低延遲的推理速度。Nexa AI Octopus 系列模型則在邊緣設(shè)備上運(yùn)行,以超越 GPT-4 的準(zhǔn)確性和延遲,同時(shí)減少了 95% 的上下文長度。Apple 的 OpenELM 和 Ferret-v2 模型通過 iOS 集成,提供了類似系統(tǒng)服務(wù)的功能擴(kuò)展。Microsoft 的 Phi 系列,特別是 Phi-3-mini 模型,即使在移動(dòng)部署中也展現(xiàn)出與大型模型相媲美的性能。此外,MiniCPM-Llama3-V 2.5 和 Gemma2-9B 等開源模型也在各自的領(lǐng)域內(nèi)展現(xiàn)出卓越的性能。

端側(cè)大語言模型的應(yīng)用:端側(cè) LLMs 的應(yīng)用范圍極為廣泛,從即時(shí)消息生成、實(shí)時(shí)語言翻譯、會(huì)議摘要到醫(yī)療咨詢、科研支持、陪伴機(jī)器人、殘障人士輔助以及自動(dòng)駕駛等。例如,Google 的 Gboard 應(yīng)用利用 Gemini Nano 模型提供基于聊天內(nèi)容的快速回復(fù)建議。在翻譯領(lǐng)域,端側(cè)模型能夠在離線環(huán)境中快速響應(yīng),同時(shí)保證翻譯質(zhì)量。會(huì)議摘要應(yīng)用通過分析會(huì)議內(nèi)容,實(shí)時(shí)生成摘要,避免了云模型訂閱服務(wù)費(fèi)用和網(wǎng)絡(luò)延遲問題。在醫(yī)療領(lǐng)域,端側(cè)模型能夠在本地處理患者數(shù)據(jù),保護(hù)隱私同時(shí)提供緊急情況下的快速響應(yīng)。

科研支持方面,端側(cè) LLMs 能夠利用特定領(lǐng)域的大量專業(yè)數(shù)據(jù)進(jìn)行訓(xùn)練,加速科研進(jìn)展。陪伴機(jī)器人和 IoT 設(shè)備通過端側(cè) LLMs 提升了理解自然語言指令的能力。對(duì)于視障人士,端側(cè)多模態(tài)模型能夠?qū)D像轉(zhuǎn)換為文字,提供豐富的圖像描述,并支持離線使用。此外,手語識(shí)別和翻譯項(xiàng)目也利用了端側(cè)模型的低延遲和離線可用性。

自動(dòng)駕駛領(lǐng)域,結(jié)合大規(guī)模視覺語言模型的系統(tǒng)正在改善車輛對(duì)復(fù)雜和長尾場景的理解,提供即時(shí)響應(yīng)并處理動(dòng)態(tài)場景。

圖 5 展示了端側(cè) LLMs 在不同應(yīng)用領(lǐng)域的表現(xiàn),從文本生成、翻譯、會(huì)議摘要、醫(yī)療應(yīng)用、科研支持、伴侶機(jī)器人、殘障人士輔助到自動(dòng)駕駛等,端側(cè) LLMs 正以其智能、響應(yīng)迅速和個(gè)性化的特點(diǎn),改變我們與技術(shù)的互動(dòng)方式。

7 未來展望:邊緣計(jì)算的智能轉(zhuǎn)型

圖 6:on-device LLM 的未來方向和面臨的挑戰(zhàn)

在設(shè)備上運(yùn)行的大型語言模型(LLMs)正迅速發(fā)展,它們?cè)跀?shù)據(jù)安全、低延遲和個(gè)性化 AI 體驗(yàn)方面展現(xiàn)出巨大潛力。然而,要在資源受限的設(shè)備上部署這些模型,我們必須克服包括模型壓縮、高效推理、安全性和能源效率等一系列挑戰(zhàn)。未來的研究將致力于開發(fā)新的隱私保護(hù)技術(shù),如查詢混淆和先進(jìn)的隨機(jī)化技術(shù),同時(shí)加強(qiáng)風(fēng)險(xiǎn)評(píng)估和監(jiān)控,以確保模型的實(shí)用性和數(shù)據(jù)的安全性。此外,研究者們也在探索適應(yīng)性邊緣 - 云協(xié)作,通過智能緩存、請(qǐng)求分析和資源分配算法,優(yōu)化數(shù)據(jù)在邊緣設(shè)備與云服務(wù)器間的傳輸。

多模態(tài)和跨模態(tài)學(xué)習(xí)是推動(dòng) LLMs 發(fā)展的關(guān)鍵方向,它們使模型能夠整合并理解多種數(shù)據(jù)類型,從而提供更豐富的用戶體驗(yàn)。研究者們正致力于開發(fā)高效的多模態(tài)處理技術(shù),以及能夠適應(yīng)不同模態(tài)輸入的模型架構(gòu)。同時(shí),資源效率也成為研究的重點(diǎn),通過模型壓縮和執(zhí)行算法的優(yōu)化,以及利用模型稀疏性,可以顯著降低模型在邊緣設(shè)備上的能源消耗,這對(duì)環(huán)境保護(hù)具有重要意義。

為了進(jìn)一步提升 LLMs 的性能,硬件 - 軟件的協(xié)同設(shè)計(jì)變得至關(guān)重要。未來的研究將探索新的 PIM/PNM 架構(gòu),以及針對(duì) AI 特定需求優(yōu)化的編譯器和運(yùn)行時(shí)系統(tǒng)。此外,確保模型的魯棒性和可靠性也是未來工作的重點(diǎn),研究者們正在開發(fā)方法以檢測和減輕模型輸出中的偏見和幻覺,特別是在安全關(guān)鍵的應(yīng)用中。

個(gè)性化 AI 體驗(yàn)是設(shè)備上 LLMs 的另一大優(yōu)勢,但這也帶來了模型持續(xù)學(xué)習(xí)和適應(yīng)新信息的挑戰(zhàn)。未來的研究將集中于實(shí)現(xiàn)知識(shí)保留和遺忘的可控機(jī)制,以及開發(fā)持續(xù)學(xué)習(xí)的理論基礎(chǔ)和優(yōu)化策略。通過這些機(jī)制,模型能夠根據(jù)用戶交互和本地?cái)?shù)據(jù)自主學(xué)習(xí)新技能,并提高現(xiàn)有能力。

8 結(jié)語

在設(shè)備上部署的大型語言模型(LLMs)正開啟智能邊緣計(jì)算的新篇章,預(yù)示著一個(gè)個(gè)性化、高效的 AI 時(shí)代即將到來。這些模型通過強(qiáng)化數(shù)據(jù)安全、降低延遲,并提供深度個(gè)性化的體驗(yàn),將徹底改變我們與技術(shù)的互動(dòng)。展望未來,隨著技術(shù)的不斷成熟,我們期待一個(gè)設(shè)備更智能、服務(wù)更精準(zhǔn)、生活更便捷的新世界。個(gè)性化的 AI 將融入日常生活的方方面面,從智能家居到自動(dòng)駕駛,從虛擬助手到健康監(jiān)護(hù),它們將以前所未有的方式提升我們的生活品質(zhì)。隨著研究的深入,一個(gè)更智能、更可靠、更貼近人心的 AI 未來正向我們招手,讓我們滿懷期待,迎接這個(gè)由 LLMs 引領(lǐng)的創(chuàng)新紀(jì)元。

為了進(jìn)一步促進(jìn)學(xué)術(shù)交流和知識(shí)共享,我們建立了一個(gè)專門的 GitHub 資源庫 ——Awesome LLMs on Device。這個(gè)資源庫不僅收錄了本論文的詳細(xì)內(nèi)容,還將持續(xù)更新,以反映該領(lǐng)域的最新研究成果和技術(shù)動(dòng)態(tài)。

誠邀學(xué)術(shù)界同仁訪問我們的 GitHub 資源庫,參與到 LLMs 在邊緣設(shè)備上的研究中來,共同推動(dòng)智能邊緣技術(shù)的創(chuàng)新與發(fā)展。

Github Repo:https://github.com/NexaAI/Awesome-LLMs-on-device

免責(zé)聲明:本網(wǎng)信息來自于互聯(lián)網(wǎng),目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)。其內(nèi)容真實(shí)性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系我們,本站將會(huì)在24小時(shí)內(nèi)處理完畢。

日韩在线免费高清视频| 国产精品色噜噜| 2018中文字幕一区二区三区| 国产91在线播放九色| 一区二区三区久久| 日本黄网免费一区二区精品| 99久久精品国产一区色| 亚洲区在线播放| 91超薄肉色丝袜交足高跟凉鞋| 99re只有精品| 日韩欧美国产综合一区| 欧美精品无码一区二区三区| 99久久精品国产精品久久| 国产自摸综合网| 色av性av丰满av| 亚洲欧美日韩国产中文专区| 国产亚洲精品成人a| 一区二区三区四区在线播放| 久久久国产精华液999999| 蜜桃一区二区三区在线观看| 奇门遁甲1982国语版免费观看高清| 久久精品美女视频| 精品乱人伦一区二区三区| 思思久久精品视频| 亚洲激情图片一区| 精品一区二区三区毛片| 国产成人av自拍| 国产视频一区二区不卡| 国产91丝袜美女在线播放| 亚洲乱码中文字幕综合| 400部精品国偷自产在线观看| 国产精品原创巨作av| 国产麻豆乱码精品一区二区三区| 无码精品视频一区二区三区| 亚洲第一页在线| 日本wwww色| 色噜噜狠狠成人网p站| 日本在线观看免费视频| 一区二区三区四区不卡在线| av日韩一区二区三区| 99视频精品全部免费在线| 青青草国产精品| 国产精品自产自拍| 欧美极品一区二区| 久久99精品一区二区三区| 国产麻豆日韩| 国模少妇一区二区三区| 国产一区二区三区在线视频| 中文乱码人妻一区二区三区视频| 欧美日韩国产区一| www.啪啪.com| 欧美大片一区二区| 69堂免费视频| 亚洲一区二区在线免费观看视频 | 亚洲国产精品自拍| 日韩成人精品视频在线观看| 亚洲精品少妇30p| 久久人人爽av| 欧美性一级生活| 亚洲av片不卡无码久久| 国产亚洲va综合人人澡精品| 欧美一区二区影视| 91蝌蚪国产九色| 99国产精品白浆在线观看免费| 99国产精品久久久久久久久久久 | 国产福利不卡| 国产伦精品一区二区三区免费迷| 三区精品视频观看| 久久久精品人体av艺术| 精品欧美一区免费观看α√| 欧美日韩亚洲系列| 九九九久久久久久久| 欧美一级专区免费大片| 国产盗摄x88av| 欧美交受高潮1| 日韩精品电影一区亚洲| 日韩精品不卡| 亚洲天堂网中文字| 肉丝美足丝袜一区二区三区四| 精品国产乱码久久久久久牛牛| 久艹在线观看视频| 欧美激情精品久久久久久蜜臀| 91久久精品无码一区二区| 国产高清一区视频| 成人性视频网站| 一区二区三区入口| 精品久久久久久无| 日本三级一区二区三区| 国产男人精品视频| 国产福利电影一区二区三区| 欧美a级免费视频| 欧洲精品在线观看| 欧美三级日本三级| 国产ts一区二区| 粉嫩av一区二区三区| 欧美日韩怡红院| 亚洲成人网在线观看| 国产日韩在线免费观看| 国产精品日韩二区| 综合精品久久久| 美女洗澡无遮挡| 欧美国产日韩一区| 激情综合色综合久久| 99蜜桃臀久久久欧美精品网站| 日韩视频在线永久播放| av手机天堂网| 免费毛片一区二区三区久久久| 一区二区三区在线免费视频| 免费黄色片网站| 欧美在线观看日本一区| thepron国产精品| 精品久久久久久无码人妻| 久久成人精品一区二区三区| 精品在线一区二区| 亚洲精品怡红院| 亚洲欧美日韩天堂| 亚洲欧美黄色片| 超碰成人在线免费观看| 欧美日韩一区二区三区四区| 国产一级片毛片| 欧美成人dvd在线视频| 亚洲在线观看免费| 日韩成人在线免费视频| 精品视频一区二区三区四区| 五月婷婷综合网| 97久久久久久久| 国产一级二级三级精品| 色综合天天天天做夜夜夜夜做| 1024手机在线视频| 国产一区二区三区奇米久涩| 丁香五六月婷婷久久激情| 91porny在线| 欧洲高清一区二区| 欧美一区二区网站| 狠狠综合久久av一区二区| 成人黄色片视频| 亚洲天堂av综合网| 青青草原综合久久大伊人精品优势| 91视频 -- 69xx| 精品久久国产精品| 国产福利电影一区二区三区| 特级西西人体wwwww| 情事1991在线| 一级日本不卡的影视| 久青草免费视频| 神马影院一区二区| 亚洲国产黄色片| 国产乱码一区二区三区| 最新中文字幕视频| av一本久道久久波多野结衣| 亚洲福利视频一区| 中文字幕 国产| 欧在线一二三四区| 久久久久久亚洲精品不卡| 国产精品视频你懂的| 乱老熟女一区二区三区| 看欧美日韩国产| 91精品蜜臀在线一区尤物| 久久久久久一区二区| 无码人妻aⅴ一区二区三区玉蒲团| 日韩av成人在线观看| 午夜视频一区二区| www香蕉视频| 一级黄色片在线免费观看| 国产精品一久久香蕉国产线看观看| 欧美性xxxxx极品| 国产91免费在线观看| 男女高潮又爽又黄又无遮挡| 777精品视频| 中文字幕第一区第二区| 法国空姐电影在线观看| 狠狠色综合一区二区| 亚洲美女av在线| 中文字幕色av一区二区三区| 国产99视频在线| 法国伦理少妇愉情| 久久久国产精华液999999| 午夜精品久久久久久久久久久久久| 91精品视频网| 婷婷开心激情综合| 九九视频精品免费| 日韩和一区二区| 午夜影院免费观看视频| 麻豆成人小视频| 日韩亚洲在线观看| 精品久久香蕉国产线看观看gif| 久久99精品久久久久久动态图 | 欧美体内she精高潮| 亚洲成色www久久网站| 欧美成人午夜免费视在线看片 | 免费91麻豆精品国产自产在线观看| 精品免费在线观看| 国产成人啪免费观看软件| 日韩xxxxxxxxx| 一级黄色高清视频| 亚洲国产欧美日韩| 日韩av电影中文字幕| 精品国产乱码久久久久久1区2区 | 国产精品高潮呻吟久久| 凸凹人妻人人澡人人添| 日本中文在线视频| 国内自拍视频网| 日本一区免费| 欧亚精品中文字幕| 日韩av影视综合网| 精品日韩视频在线观看| 国产福利一区二区三区视频| 国产精品久久无码一三区| 波兰性xxxxx极品hd| 日本中文字幕二区| 欧美一区二区福利视频| 无码av中文一区二区三区桃花岛| 久久久久.com| 中文字幕五月天| 四季av一区二区三区| 在线综合视频网站| 国产精品最新在线观看| 亚州欧美日韩中文视频| 国产亚洲精品一区二区| 日韩一区二区三区在线视频| 国产精品色噜噜| 毛片基地黄久久久久久天堂| aaa在线视频| 国精产品视频一二二区| 天天干天天色天天干| 日韩中文字幕在线不卡| 国产日韩欧美一区二区| 欧美最近摘花xxxx摘花| 中文字幕久久亚洲| 欧美成人午夜电影| 国产精品久久久久久久久搜平片| 亚洲国产精品久久久久久久| 日本三级欧美三级| 国产又黄又粗视频| 色婷婷.com| 国产精品日韩三级| 久热这里只精品99re8久| 国产精品成人国产乱一区| 日韩三级视频在线看| 欧美影院午夜播放| 欧美日韩国产综合视频在线观看| 欧美视频一二三| 久久久久久久黄色片| 黄色录像二级片| 波多野结衣先锋影音| 亚洲无在线观看| 91视频 -- 69xx| 成人手机视频在线| 精品一区二区三区国产| 久久久久久欧美精品色一二三四| 国产精品黄色影片导航在线观看| 久久99精品视频一区97| 神马国产精品影院av| 日韩电视剧在线观看免费网站| 欧美日韩美女一区二区| 色网综合在线观看| 91黄色小视频| 五月天中文字幕一区二区| 欧美国产丝袜视频| 久久综合中文字幕| jizz一区二区| 国产综合久久久久久久久久久久 | 国产1区2区3区中文字幕| 日本不卡在线观看| 欧美一级艳片视频免费观看| 亚洲一区国产视频| 亚洲一区自拍偷拍| 亚洲欧美日本在线| 亚洲一区中文在线| 亚洲成人动漫精品| 午夜av一区二区| 一区二区三区四区五区视频在线观看| 中文字幕免费观看一区| 国产日本欧美一区二区| 久久久久久黄色| 99久久精品免费看国产免费软件| 成人国产精品免费观看动漫| 成人综合激情网| 成人自拍视频在线| 懂色av一区二区三区蜜臀| 国产精品18久久久久久久网站| 国产不卡视频一区| 国产成人精品三级| 成人综合婷婷国产精品久久蜜臀| 国产精品2024| 26uuu精品一区二区在线观看| 久久精品日产第一区二区三区高清版 | 翔田千里亚洲一二三区| 在线观看国产一区| 大伊香蕉精品视频在线| 国产精品9999| 国产成人一区二区三区| 国产精品久久久久久亚洲影视| 91精品久久久久久久久久久| 5g国产欧美日韩视频| 久久精品日韩精品| 椎名由奈jux491在线播放| 黄黄视频在线观看| 1024av视频| www.色就是色| 大乳护士喂奶hd| 亚洲色图综合区| 无码人妻aⅴ一区二区三区有奶水| 国产又大又黑又粗| 日韩不卡手机在线v区| 粉嫩13p一区二区三区| 久久久精品蜜桃| 亚洲少妇30p| 色天使久久综合网天天| 亚洲精品国产拍免费91在线| 中国人与牲禽动交精品| 欧美一级高清免费播放| 精品国产中文字幕| 大荫蒂性生交片| 国产成人在线综合| 欧美人与禽zoz0善交| 日操夜操天天操| 空姐吹箫视频大全| 97久久久精品综合88久久| 亚洲丰满少妇videoshd| 欧美美女一区二区在线观看| 欧美高清在线视频观看不卡| 精品久久人人做人人爰| 欧美电影影音先锋| 久久精品欧美视频| 成人在线视频网| 亚洲精品少妇一区二区| 欧美性猛交乱大交| 翔田千里88av中文字幕| 一本色道久久综合亚洲| 国产专区欧美精品| 亚洲欧美乱综合| 在线播放欧美女士性生活| 日韩亚洲欧美成人| 97在线中文字幕| 999在线观看视频| 日韩在线免费观看av| 狠狠人妻久久久久久| 视频在线观看91| 亚洲欧美国产三级| 欧美精品一区二区在线播放| 777精品视频| 五月天婷亚洲天综合网鲁鲁鲁| 中文字幕第三区| 天堂网视频在线| 国产专区综合网| 日韩欧美亚洲国产一区| 中文字幕日韩欧美精品在线观看| 成人av.网址在线网站| 成年女人18级毛片毛片免费| 国产高清一区二区三区四区| 国产精品无码久久av| 99视频国产精品| 在线播放中文一区| 日韩av电影院| 国产不卡一区二区视频| 日本精品在线免费观看| 天天操天天射天天舔| 久久久久久久久久久网| 媚黑女一区二区| 亚洲欧美精品午睡沙发| 国产亚洲美女精品久久久| 韩日午夜在线资源一区二区 | 91动漫在线看| 99国产精品免费| 三级影片在线观看欧美日韩一区二区| 亚洲另类中文字| 日韩成人免费视频| av一区观看| 亚洲一区二区在线免费| 亚洲精品第五页| 亚洲福利一区二区三区| 欧美成人午夜剧场免费观看| 日韩av一区二区三区在线观看| a级一a一级在线观看| 日韩精品电影一区亚洲| 91福利在线导航| 欧美一性一乱一交一视频| 欧美这里只有精品| 免费一级片在线观看| 99久久亚洲一区二区三区青草| 欧美一区二区美女| 国产66精品久久久久999小说| 欧美日韩人妻精品一区在线| 亚洲国产精品一| 一本大道av一区二区在线播放 | 国产一区二区不卡视频| 人妻无码一区二区三区| 麻豆精品一区二区三区| 51精品久久久久久久蜜臀| 99www免费人成精品| 高清视频一区二区三区| 可以在线看的黄色网址| 中文字幕一二区| 亚洲女人****多毛耸耸8| 久久这里只有精品99| 黄色片免费在线观看视频| 五月天丁香激情| 国产香蕉久久精品综合网| 这里只有视频精品| 久久www视频| 亚洲乱码国产乱码精品| 国产精品久久久久久亚洲伦 | 午夜免费高清视频| 国产又粗又猛又黄又爽| 精品电影在线观看| 91欧美精品成人综合在线观看| 精品国产aⅴ一区二区三区东京热| 欧美自拍偷拍一区二区| 欧美色区777第一页|