亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

百元級硬件流暢運行百億參數LLM!上交&本智激活開源端側原生LLM

IP屬地 中國·北京 編輯:馮璃月 量子位 時間:2025-07-27 18:16:57

允中 發自 凹非寺
量子位 | 公眾號 QbitAI

AI的下一個戰場,不在云端,而在你的口袋里。

iPhone、華為、三星、小米、OPPO等各大手機廠商幾乎都在將大模型塞進手機,端側AI已然成為兵家必爭之地。

背后的邏輯清晰而堅定:最懂你的AI,必須能安全地訪問你的個人數據——郵件、照片、日程,而這一切的前提,就是將計算留在本地,將隱私還給用戶

然而,想讓AI在本地流暢運行,遠比想象的要難得多。最好的證據,莫過于財力雄厚、軟硬一體的蘋果,其雄心勃勃的Apple Intelligence計劃也未能如期而至,核心AI功能不得不推遲到明年。

這無疑向整個行業釋放了一個清晰的信號:端側AI,是一塊難啃的硬骨頭。

正當全球科技巨頭在端側AI的道路上艱難探索時,一股產學研深度融合的新興力量,給出了獨有的解決路線。

今天,上海交通大學IPADS研究所、上海交通大學人工智能學院聯合初創公司本智激活(Zenergize AI),在HuggingFace開源了端側原生大模型SmallThinker。

該系列模型采用為端側算力、內存、存儲特性而原生設計的模型架構,并從零開始預訓練,具體包含兩個尺寸的稀疏模型,分別是SmallThinker-4B-A0.6B和SmallThinker-21B-A3B,模型也已開源,鏈接如下。

https://huggingface.co/PowerInfer/SmallThinker-21BA3B-Instructhttps://huggingface.co/PowerInfer/SmallThinker-4BA0.6B-Instruct

其顯著特征,就是用端側CPU即可快速推理,不再依賴高端GPU
其中,4B模型在1GB峰值內存下的推理速度達到驚人的19.41tokens/s。

而更令人矚目的是,21B旗艦稀疏模型,在一塊百元級的國產RK3588開發板上,實現了相較于同等能力的主流模型(Qwen-14B)高達21倍的推理加速,將同類解決方案遠遠甩在身后。

SmallThinker:端側原生大模型

主流大模型,從出生起就是為云端成千上萬TOPS算力、TB級顯存的GPU集群“量身定制”的。想把它們塞進算力、內存等都不到云端5%的端側設備,傳統方法只有“壓縮”。

這就好比讓一個“博士生”模型,通過蒸餾、量化等手段,強行“降智”,最終變成一個只會簡單問答的“小學生”,犧牲了太多智能。

是否存在一種不做“模型降智”,而是一步到位的選擇?

為了實現這一目標,SmallThinker系列針對端側的弱算力、小內存、慢存儲,設計了創新的大模型架構,并從零開始預訓練,實現了與端側硬件的“精巧匹配”。



具體來說,這一端側原生的大模型架構主要擁有三大核心技術特性:

第一,端側算力原生的雙層稀疏架構,稀疏度提升5倍。

傳統的MoE(混合專家模型)只在專家層面是稀疏的。而SmallThinker在此基礎上,增加了專家內部的神經元稀疏。

這就好比,模型不僅能精準調用最相關的專家知識,還能只激活專家知識庫里最核心的部分,避免“復述全部所學”,對端側算力的要求大大降低。



第二,端側存儲原生的專家路由前置,顯著隱藏IO開銷。

在內存資源受限的端側,通常模型權重不能完全放置在內存里,需要在推理過程中動態從慢速存儲(比如SSD、UFS等)加載模型專家權重,而在這個過程中,端側的慢速I/O會嚴重影響推理速度。

傳統方案是算完注意力,再計算路由,最后排隊等待加載專家。

而SmallThinker在模型架構中就原生提供了機制,幫助預判需要哪個專家,在進行注意力計算的同時,就去異步加載專家。

做到了“邊檢查邊傳喚”,將I/O等待時間隱藏在注意力計算的過程中。



第三,端側內存原生的混合稀疏注意力,KV緩存占用下降76%。

針對長文本場景,SmallThinker設計了“略讀”+“精讀”的混合注意力機制。它使用滑動窗口注意力(Sliding Window)進行高效的“略讀”,同時保留全局注意力的能力進行“精讀”。

兩種方式組合,在處理16K文本時,相比傳統GQA機制,KV緩存占用降低76%,讓端側設備也能輕松處理長文檔



生態兼容性與極致性能:SmallThinker與PowerInfer的完美結合

一個真正優秀的開源模型,不僅自身要強大,更要擁抱廣闊的開放生態。
SmallThinker模型系列在設計上充分考慮了開發者的使用習慣,能夠無縫兼容HuggingFace Transformers、vLLM、SGLang、llama.cpp、KTransformers等一系列主流推理框架。

在硬件適配上,它實現了對英特爾、英偉達、高通等主流芯片,甚至已經可以在國產鴻蒙操作系統上進行推理。這種開箱即用的靈活性,極大地降低了開發者的使用門檻。

而要體驗SmallThinker最極致的端側加速與內存優化效果,則需要使用團隊為其量身打造的端側原生Infra——PowerInfer(https://github.com/SJTU-IPADS/PowerInfer/blob/main/smallthinker/README.md)。

PowerInfer是團隊于2023年12月開源的業界首個稀疏大模型端側推理框架,發布后迅速獲得全球開發者的高度關注,目前GitHub星標已達8.2K,并曾連續兩天蟬聯GitHub全球項目趨勢榜第一。

它能夠深度激活SmallThinker原創的雙層稀疏架構,在推理時只調用必要的專家及神經元,并能在不影響推理速度的情況下降低內存占用。

它就像是為SmallThinker這臺“F1賽車”專門打造的引擎,為開發者提供了一套從模型到部署、真正完整的全棧優化解決方案。

SmallThinker模型智力與推理性能兼具

理論再好,也要看療效。SmallThinker團隊交出的,是一份模型能力與端側推理性能兼備的答卷。

為了真正實現“端側原生”,團隊從零開始預訓練,基于高質量數據語料,訓練了兩種規模的模型:

SmallThinker-4B-A0.6B:基于2.5T Tokens數據預訓練,擁有40億參數,激活6億參數,主打極速響應SmallThinker-21B-A3B:基于7.5T Tokens數據預訓練,擁有210億參數,激活30億參數,主打旗艦性能。它能夠在百元級RK3588上流暢部署,全內存情況下的CPU推理速度也能達到10.84 tokens/s。

口說無憑,評測見真章。

在MMLU、GPQA等多個權威評測基準上,SmallThinker的智力水平均超越了同尺寸甚至更大尺寸的開源模型,充分證明了其“原生”架構設計的優越性。



而在更關鍵的實際運行性能上,當SmallThinker與PowerInfer結合時,其在內存約束場景下的優勢盡顯。團隊在旗艦移動平臺和個人電腦PC上,對業界主流模型進行了正面硬剛。

場景一: 手機極限內存瓶頸 (1GB RAM)

在主流手機上,SmallThinker-4B-A0.6B模型的Q4量化版本,在僅調用4個CPU核心的情況下,推理速度便高達79 tokens/s。

而在對模型架構與推理框架構成終極考驗的極限內存瓶頸(1GB)場景下,SmallThinker的優勢則體現得淋漓盡致4B模型依然跑出了19.91 tokens/s的流暢速度。

作為對比,Qwen3-1.7B模型速度僅為1.07 tokens/s,幾乎無法正常使用。

近19倍的性能差距,充分證明了SmallThinker在極端資源受限環境下的卓越運行能力。這不僅是一次技術的勝利,更是將高端AI平民化的關鍵一步。

場景二: 主流PC配置(8GB RAM)

當內存放寬到旗艦PC的8GB時,SmallThinker的架構優勢依然顯著。

SmallThinker-21B-A3B的4核CPU(Intel i9 14990K)推理速度達到20.30 tokens/s,而Qwen3-30B-A3B的4核CPU速度為10.11 tokens/s,加速比達到2倍。

未來展望:不止于此,通往端側原生智能

在這訓練過程中,團隊發現;即使在如此龐大的數據投喂之后,模型的loss曲線仍在穩步下降,仍未達到飽和

未來,團隊會圍繞兩條路線演進。

第一條路線,繼續Scaling:更大更強。

既然模型尚未“吃飽”,那么最直接的路徑就是——繼續投喂。

團隊的下一步計劃,將繼續遵循被驗證有效的Scaling Law,利用更多的高質量Tokens進行進一步訓練。進一步壓榨模型潛力,在知識儲備、邏輯推理和代碼生成等核心能力上,將SmallThinker推向新的高度,打造出更強大的端側基礎模型。

第二條路線,打造“個人賈維斯”:從模型到可信賴的智能體。

如果說Scaling Law是讓模型變得更“博學”,那么團隊的終極野心,則是打造一個真正屬于每個人的“賈維斯式”智能體。

這個智能體的獨特之處在于,它完全運行在你的個人設備上,能夠安全、完整地理解你的全部數字生命——從郵件、日程,到聊天記錄和相冊。正是在這片獨一無二的私有數據土壤之上,才能生長出“千人千面”、真正懂你的可信賴AI。

相信未來,隨著端側原生AI能力的不斷進步,未來的AI能力就會像今天的水和空氣一樣,主動融入我們每個人的日常工作和生活,提供安全私密、成本低廉、充滿智慧的AI體驗。

免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

av中文字幕网址| 亚洲一二区在线观看| 欧美福利精品| 91免费在线看片| 久久久久久久久久久99999| 欧美另类videoxo高潮| 精品在线观看免费| 欧美一级淫片丝袜脚交| 男人天堂中文字幕| 欧美巨猛xxxx猛交黑人97人| av免费播放网站| 国产精品系列在线播放| 久久九九久久九九| 欧美成人在线网站| 国产不卡一区二区视频| 在线xxxxx| 亚洲精品男人的天堂| 在线一区二区三区做爰视频网站| 亚洲精品一区二区三区影院 | 欧美精品在线一区| 亚洲av无一区二区三区| 综合欧美一区二区三区| www.成人黄色| 亚洲v中文字幕| 中文综合在线观看| 好吊色视频一区二区三区| 精品人妻一区二区三区含羞草| 欧美日韩国产专区| 亚洲人一区二区| 亚洲精品中文字幕无码蜜桃| 99热在线观看精品| 亚洲精品福利在线| 色系列之999| 日韩国产一区久久| 欧美精品韩国精品| 亚欧激情乱码久久久久久久久| jlzzjlzz亚洲日本少妇| 久久66热这里只有精品| 奇米影视在线99精品| 亚洲自拍偷拍区| 亚洲xxx在线| 亚洲欧美日韩天堂一区二区| 久久综合精品一区| 国模私拍在线观看| av高清不卡在线| 国产91精品久久久久| 狠狠色综合网站久久久久久久| 无码成人精品区在线观看| 日韩一区二区三区四区五区六区| 久久精品夜夜夜夜夜久久| 久久精品无码一区二区三区毛片| 国产精品自拍在线| 久久精品视频网| 国产精品h视频| 奇米亚洲午夜久久精品| 亚州精品一二三区| 日韩av在线免费观看| 日韩 欧美 综合| 亚洲国产精品va在看黑人| 欧美lavv| 美国毛片一区二区三区| 在线视频一区二区| 久久午夜夜伦鲁鲁一区二区| 亚洲va在线观看| 日韩久久午夜影院| 国产精品白嫩白嫩大学美女| 国产一区中文字幕| 久久亚洲国产精品日日av夜夜| 中文字幕 国产| 麻豆精品新av中文字幕| 久久av免费一区| 欧美精品与人动性物交免费看| 日本黄网站色大片免费观看| 永久免费成人代码| 欧美日韩不卡一区二区| 蜜臀av一区二区三区有限公司| 日韩中文字幕免费看| 国产精品6666| 在线影院国内精品| 成人在线免费观看av| 国产高清亚洲一区| 亚洲图片小说在线| 成人黄色片在线观看| caoporn国产精品| 亚洲电影在线看| 手机在线视频你懂的| 青青草97国产精品免费观看无弹窗版| 国产精品嫩草在线观看| 国产成人久久精品77777综合| 97免费资源站| 91麻豆.com| 日本天堂网在线观看| 视频一区二区三| 欧美性猛片aaaaaaa做受| 国产99免费视频| 亚洲已满18点击进入在线看片 | 热久久久久久久| 高清视频在线观看一区| 无码人妻一区二区三区线| 亚洲国产精品系列| 国产成人精品a视频| 日韩在线不卡视频| 中国毛片直接看| 中文字幕亚洲字幕| 欧美特黄一级片| 日韩美一区二区三区| 右手影院亚洲欧美| 久久久视频在线| 亚洲成人性视频| 国产精品狼人久久影院观看方式| 日韩精品电影一区二区三区| 久久伊人资源站| 91蝌蚪porny九色| 99re国产视频| 亚洲综合一区二区三区| 国产chinesehd精品露脸| 欧美三级日本三级少妇99| 国产成人精品视频免费看| 国产成人亚洲综合a∨婷婷图片| 97在线观看免费高| 一本色道久久88综合日韩精品| 在线观看一二三区| 三区精品视频| 国产日韩欧美精品电影三级在线 | 欧美高清性xxxx| 久久久久国产免费免费| 成人有码在线播放| 三级黄色在线观看| 日韩欧美在线影院| 国模大尺度视频| 国产精品乱码久久久久久| 国内自拍中文字幕| 91一区二区在线| 成人av播放| 国产日韩欧美不卡| 国产福利一区二区三区在线观看| 欧美日韩激情在线观看| 欧美中文字幕不卡| 一级做a免费视频| 国产香蕉久久精品综合网| 欧美尤物一区| 国产乱码精品一区二区三区忘忧草 | 亚洲色婷婷一区二区三区| 欧美色中文字幕| 91精品视频国产| 色婷婷久久99综合精品jk白丝| 成年人网站免费在线观看| 亚洲黄网站在线观看| 草草草视频在线观看| 伊人一区二区三区| 欧美做爰爽爽爽爽爽爽| 在线观看日韩片| 亚洲无限av看| 国产在线综合网| 久久99精品久久久久久噜噜| 亚洲男人第一av| 日产日韩在线亚洲欧美| 亚洲第一视频在线观看| 欧美经典一区二区| 那种视频在线观看| 欧美日韩免费一区| 波多野结衣家庭教师在线观看 | 5566中文字幕一区二区| 天天爽夜夜爽夜夜爽| 成人自拍视频网站| 久久精品亚洲国产奇米99| 午夜肉伦伦影院| 午夜久久久久久久久久影院| 国产精品情侣呻吟对白视频| 亚洲成色999久久网站| 美女爆乳18禁www久久久久久| 日韩精品在线观看一区| 亚洲天堂中文在线| 成人性做爰aaa片免费看不忠| 亚洲bt天天射| 亚洲一区二区免费在线| 国产精品美女久久久久久免费| 97人洗澡人人免费公开视频碰碰碰| 欧美精品xxxxbbbb| 国产一区二区不卡| 免费黄色网址在线| 亚欧激情乱码久久久久久久久| 奇米888一区二区三区| 在线中文字幕一区二区| 香蕉人妻av久久久久天天| 一级成人免费视频| 99精品人妻国产毛片| 波多野结衣激情| 最近2019免费中文字幕视频三| 黄色片视频免费| 欧美性受xxxx黑人猛交88| 色伊人久久综合中文字幕| 午夜国产福利视频| 成人激情视频网| 婷婷中文字幕综合| 国产污视频网站| 天堂www中文在线资源| 亚洲一二三区在线| 欧美日韩一区二| 国产午夜精品久久久久久久| 国产无遮挡在线观看| 鲁一鲁一鲁一鲁一色| 国产福利片一区二区| 国产精品激情自拍| 久久av中文字幕| 欧美日韩精品欧美日韩精品| 精品动漫一区二区| 亚洲精品喷潮一区二区三区| 自慰无码一区二区三区| 97欧美精品一区二区三区| 亚洲精品美腿丝袜| 性欧美8khd高清极品| 二区三区在线视频| 韩国av免费在线观看| 免费视频久久久| 国产女人被狂躁到高潮小说| 韩国av中文字幕| 懂色av成人一区二区三区| 亚洲午夜在线视频| 一区二区三区 在线观看视| 98精品国产高清在线xxxx天堂| 精品一区二区三区视频日产| 日韩av电影免费观看| 精品一区日韩成人| 国产欧美日韩亚洲| 另类色图亚洲色图| 俺也去精品视频在线观看| 欧美日本高清视频| 亚洲欧美一区二区三区国产精品 | 首页亚洲欧美制服丝腿| 久久网这里都是精品| 中文字幕在线不卡一区二区三区| 26uuu国产日韩综合| 亚洲sss视频在线视频| 亚洲国产精品久久久久秋霞影院| 国产午夜精品一区理论片飘花| 亚洲第一精品区| 国产 欧美 日韩 在线| 国产日本欧美一区二区| 日韩午夜在线视频| 国产精品美乳在线观看| 国产精品久久久久久久久久ktv| 欧美黑人一区二区三区| 亚洲精品免费网站| 日韩免费av电影| 91av资源网| 中文字幕无码毛片免费看| 欧美另类视频在线| 97人人模人人爽人人喊38tv| 8x拔播拔播x8国产精品| 欧美老女人xx| 久热精品在线视频| 国产成人免费91av在线| 欧美lavv| www.九色.com| 日本一二三区在线| 波多野结衣黄色| 26uuu国产在线精品一区二区| 91精品国产综合久久久久久久久久| 国自在线精品视频| 精品视频在线观看一区| 国产原创剧情av| 色一情一交一乱一区二区三区| 日韩免费av网站| av在线一区二区三区| 日韩女优视频免费观看| 精品视频一区三区九区| 91麻豆精品国产综合久久久久久| 日韩欧美成人午夜| 少妇熟女一区二区| 一级片久久久久| 永久看片925tv| 国产一区欧美一区| 欧美日韩和欧美的一区二区| 久久人人看视频| 久久成人精品电影| 91网址在线播放| 精品人妻无码一区二区色欲产成人| 亚洲韩国精品一区| 久久精品在线免费视频| 九色|91porny| 国产欧美精品一区二区| 日本裸体美女视频| 亚洲六月丁香色婷婷综合久久 | 最近中文字幕在线mv视频在线| 1级黄色大片儿| 韩国一区二区三区| 亚洲精品av在线| 欧美激情视频网| 成人av免费看| 91亚洲一线产区二线产区| 国产精品综合在线视频| 久久久久久亚洲| 久久一区二区精品| 久久久久久国产精品日本| 美女精品一区| 国产精品久久网| 国产成人a v| 久久色精品视频| 波多野结衣一二三四区| 色香蕉久久蜜桃| 国产专区一区二区| 成人黄色免费网址| 国产成人午夜精品影院观看视频| 欧美色爱综合网| 亚洲综合av影视| 九九九久久久久久久| 久久精品99国产精品| 五月婷婷综合网| 久久精品国产一区| 成人免费在线小视频| 中文字幕免费观看| 欧美激情xxxx性bbbb| 欧美性猛交xxxx乱大交少妇| 三级黄色在线视频| 亚洲在线免费播放| 91九色在线免费视频| 免费毛片在线播放免费| 国产欧美视频一区二区三区| 色综合久久久网| 日本精品久久久久久久久久| 日本视频中文字幕一区二区三区| 久久久免费电影| 丰满肉肉bbwwbbww| 久久偷看各类wc女厕嘘嘘偷窃| 99精品欧美一区| 少妇高潮大叫好爽喷水| 久久精品在这里| 一级一片免费播放| 国产精品热久久| 麻豆乱码国产一区二区三区| www.xxx麻豆| 日韩黄色在线观看| 亚洲图片制服诱惑| 无码人妻精品一区二区中文| 婷婷开心久久网| 日韩精品在线视频免费观看| 国产色片在线观看| 在线一区二区三区| 国产视频不卡| 欧美日韩精品区| 在线亚洲一区二区| 一区二区三视频| 天天操天天射天天舔| 久久97精品久久久久久久不卡| 精品爆乳一区二区三区无码av| 日韩黄色av网站| 亚洲综合激情视频| 91成人看片片| 男人网站在线观看| 日本黄色一区二区| 国语对白在线播放| 国产成人精品av在线| 丁香亚洲综合激情啪啪综合| 日韩av片网站| 亚洲精品黄网在线观看| 日韩精品一区不卡| 国产在线视频2019最新视频| 日韩黄色片网站| 国模精品一区二区三区色天香| 久久精品综合视频| 亚洲福利一区二区| 激情av中文字幕| 欧美性猛交xxxx乱大交3| 中文字幕xxx| 日韩在线观看免费全| 亚洲一级片在线播放| 一区二区欧美国产| 黄黄视频在线观看| 成人精品视频一区二区三区| 国产精品一区二区性色av| 人人妻人人爽人人澡人人精品| 亚洲精选在线观看| 国产女同在线观看| 国产精品久久久久一区二区 | 精品久久久久久无码中文野结衣| 国产精品视频九色porn| 999视频在线观看| 亚洲一二三在线| 久久99精品国产99久久6尤物| 91爱爱小视频k| www.久久爱.cn| 中文字幕99| 亚洲精品乱码久久久久久自慰| 制服丝袜中文字幕第一页 | 欧美一级一区二区| 一本色道久久88亚洲综合88| 久久久久久欧美| 91久久极品少妇xxxxⅹ软件| 亚洲日本精品国产第一区| 欧美一区二区三区免费在线看| 亚洲一区二区偷拍精品| 毛片av一区二区| 3d动漫精品啪啪一区二区三区免费| 日韩精品视频网站| 欧美不卡在线一区二区三区| 久久精品国产**网站演员| 中文字幕中文字幕在线中一区高清 | 欧美日韩国产另类不卡| 天天插天天操天天干| 国产乱子伦精品| 夜夜爽夜夜爽精品视频| 日韩欧美国产综合在线| 精品久久久免费| 99久久久无码国产精品不卡| 57pao成人永久免费视频| 美女精品在线 | 91亚洲精品久久久蜜桃网站| 亚洲天堂资源在线| 国产精品视频网|