亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

趨境&清華開源項目KTransformers讓「異構」成為推理新范式

IP屬地 中國·北京 量子位 時間:2025-10-23 10:16:09

允中 發自 凹非寺
量子位 | 公眾號 QbitAI

全球AI基礎設施快速演進的浪潮中,一個誕生自中國的開源項目,正在被世界看見。

它就是KTransformers,由趨境科技與清華大學KVCache.AI團隊聯合研發,聚焦大模型推理階段的系統創新。

這是一個高性能異構推理框架,專注于高效利用底層GPU、CPU、內存等多樣化算力,讓大模型在更低算力、更靈活的硬件架構上高效運行,項目論文《KTransformers: Unleashing the Full Potential of CPU/GPU Hybrid Inference for MoE Models》入選了剛剛落幕的“計算機系統領域奧斯卡” SOSP 2025



SOSP是計算機系統領域最具影響力的國際頂會之一。過去幾十年間,從虛擬化到分布式文件系統,無數里程碑式的技術成果都曾首次亮相于此。

如今,KTransformers也在這個舞臺上獲得了全球系統學術界的最高背書。



幾乎在同一時間,KTransformers宣布與主流推理框架SGLang合作,雙方架構合入同一分支。這次合作意味著全GPU推理與異構推理的融合,推動大模型推理架構變得更加完善,將邁向更廣泛的產業落地。

在更遠的未來,它即將成為更多AI產品背后能跑得起大模型的底層路徑。

加入核心創新“專家延遲機制”,異構架構實現MoE模型高效推理

大模型推理領域,算力瓶頸正在成為全球技術界的核心問題。

尤其是當MoE(Mixture of Experts,專家混合)架構成為主流后,這個瓶頸更顯突出。MoE模型以“稀疏激活”為特征,每次推理只會調用部分專家子網絡,從而在不犧牲模型能力的前提下降低計算負擔。

問題隨之而來,如何高效調度這些專家從而避免資源浪費與設備空轉,成了產學研三界共同的新挑戰。

《KTransformers: Unleashing the Full Potential of CPU/GPU Hybrid Inference for MoE Models》正是在這一背景下誕生的。它提出了一條不同以往的道路:一套面向CPU+GPU異構架構的MoE推理系統方案,讓原本只能依賴昂貴多卡GPU的大模型,能在CPU參與的硬件環境中實現接近同等性能的推理體驗。

KTransformers的初衷是通過創新的異構推理的架構,充分釋放底層所有的硬件算力資源,優化計算調度,擺脫對單一硬件的依賴,從而實現更普惠、更高效的大模型部署與應用。



技術層面上,它通過一系列系統級創新,讓GPU負責注意力和主干網絡的高并行計算,CPU則承擔稀疏專家模塊的推理任務,實現了高效的CPU+GPU協同執行。



KTransformers的核心創新首先體現在底層算子優化上。

通過針對Intel AMX指令集開發的高吞吐計算核,結合自定義的tile-aware內存布局,KTransformers在單路Xeon上實現了PyTorch實現近4倍的提速,極大釋放了CPU在專家計算中的性能。至此,CPU成為推動系統吞吐提升的關鍵一環。

此外,KTransformers在異構任務協調方面也進行了系統性重構,為減少CPU與GPU之間的協調成本,KTransformers引入了NUMA感知張量并行和基于CUDA Graph的調度,以確保兩個設備以最小的同步延遲運行。

值得一提的是,在論文中KTransformers還提出了另一個創新技術——Expert Deferral(專家延遲機制)。

傳統MoE推理嚴格遵循層級順序,GPU必須等待CPU完成專家計算后才能繼續下一步,這種串行依賴導致了大量性能浪費。KTransformers打破了這一限制。

KTransformers研究團隊發現,Transformer模型的殘差連接具有一定的延遲容忍性,部分中間結果的計算并不需要嚴格同步完成。于是團隊提出讓部分專家計算延遲執行——也就是在GPU執行注意力模塊時,CPU專家仍在計算上一層結果,兩者并行推進。



這樣就使得CPU與GPU的負載得以動態重疊,模型吞吐提升約1.45倍,單卡decode速度最高超過30+ tokens/s,而模型精度變化低于0.5%,幾乎無損。

Expert Deferral是MoE推理異構化落地的關鍵突破,真正讓CPU與GPU實現了平等協作。

得益于這些設計,KTransformers能夠在一臺RTX 4080+雙路Xeon的單機環境中成功運行DeepSeek-V3-671B模型,單路性能接近多卡GPU集群水準。

推動推理架構融合,助力全球開發者高效創新

到今天,論文的全部思想已被完整工程化,衍生為開源系統KTransformers

這其實是推理生態流變分化的一個具象化體現:一邊是以SGLang為代表的高吞吐、高并發全GPU路線;另一邊,則是仍在探索中的讓CPU與GPU協同工作的異構路線,嘗試用更靈活、成本更低的方式支持大模型運行。

KTransformers正是后者的代表之一。

KTransformers與SGLang的合作,是雙方基于各自推理引擎能力展開深度對接,聯合推動大模型推理向更高性能、更低成本的方向演進。

SGLang,全稱Structured Generation Language,是一種專為大型語言模型(LLM)和視覺語言模型(VLM)設計的高效推理與服務框架,它通過聯合設計前端語言和后端運行時來提升模型推理的速度和靈活性。

由于在多輪對話、復雜任務規劃和結構化輸出方面表現突出,在當下的大模型推理框架生態中,SGLang成為了最主流、最具工程實用性的開源推理引擎之一。



SGLang的優勢在于通用性和工程落地能力,全GPU推理思路也更適用于高吞吐量高并發等需求,KTransformers作為算子庫合入SGLang之后,雙方互為補充,開發者用戶可以直接獲得全GPU推理與異構推理兩種能力,不再需要手動集成、單獨調用。尤其是在GPU資源受限但本地CPU富余的場合,許多原本無法落地的模型都有了新的可行路徑。

例如通過KTransformers與SGLang合作實現的Multi-GPU+CPU混合推理能力,將更多專家放置在GPU上,這減少了帶寬瓶頸下的CPU內存訪問,相對單GPU的場景極大提升吞吐量。

此次合作實現了異構推理方案與主流推理框架的深度融合。這推動了雙方底層架構的協同進化,使其邁向更成熟、更工程化的新階段;同時使開發者能夠更便捷地調用各類模型,在硬件選擇上也更具靈活性。

KTransformers,想做的不止是“在本地跑得動”

技術成果背后,是持續構建生態的決心。

如今的KTransformers已成為一個被開發者、廠商與開源社區廣泛復用的共建式底層框架。

目前,其GitHub Star數已突破15.2K,成為全球Star數排名前列的大模型推理框架。

全球頭部開源模型方,如Qwen、Kimi、智譜 AI等多個主流大模型,都在模型發布首日就推薦KTransformers作為推理引擎支持;其工程實踐與兼容性也被多家一體機產品線采納。



在這條異構路線逐漸成型的過程中,趨境科技始終是最核心的推動者之一。

在KTransformers的架構設計、核心實現、算子優化、框架適配以及社區維護等多個關鍵層面,趨境科技始終處于一線角色——

在與清華大學KVCache.AI團隊聯合研發的基礎上,趨境負責了項目中的大量底層開發、接口對接、系統調度和社區推廣工作。

這一次與SGLang的對接合作中,趨境科技也作為主要實現方與維護貢獻者,完成了從對接設計、功能聯調,到主分支合入的全部工程閉環。

對趨境來說,KTransformers輸出的是一種價值理念的承載,更是一個更長期的目標:

在大模型時代,需要有人站出來為推理基礎設施提供新的可能性。大模型落地不能只有精英算力路徑,也需要一條更廣譜的路線:以異構協同釋放本地硬件的潛力,以開源能力幫助更多團隊和組織用得起、調得動、融得進自己的業務中。

正因此,趨境已經與多個國產CPU、GPU硬件平臺合作,共同推進全國產高性價比方案;為數十家行業開發伙伴提供算力底座,逐步實現算力普惠,讓大模型真正能夠為業務所用。

今天的KTransformers,已經讓大模型推理不再專屬于高端算力;未來,趨境希望讓AI能力也不再專屬于少數企業。

Gossip time

KTransformers已經可以在一張消費級GPU上穩定運行千億參數大模型。那么,下一步呢?

給大家附上一個圈內人最近才剛知道的小道消息:

研究團隊好像已經有人在內部試水微調了。而且是在不擴卡、不改架構的前提下來做輕量調優。

從KTransformer的設計思路來看,確實是順理成章的一步:

既然推理已經解決了,那接下來的方向,不就是能跑也能調么。

大家期待的小手手可以隨時搓起來了哈!

論文鏈接:

https://madsys.cs.tsinghua.edu.cn/publication/ktransformers-unleashing-the-full-potential-of-cpu/gpu-hybrid-inference-for-moe-models/SOSP25-chen.pdf

技術細節詳見SGLang博客:

https://lmsys.org/blog/2025-10-22-KTransformers/

免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

成人国产精品久久久久久亚洲| av电影在线不卡| 韩国成人在线视频| 欧美在线观看日本一区| 男插女视频网站| 色综合咪咪久久| 亚洲精品乱码久久| 欧美制服第一页| 我不卡一区二区| 中文字幕欧美日韩一区| 麻豆av一区二区| 国产91精品在线观看| 国产精品一区二区免费| 五月色婷婷综合| 日韩中文字幕视频在线| 天天躁日日躁狠狠躁av麻豆男男| 久久久精品黄色| 中文字幕の友人北条麻妃| 久久精品一区二区| 激情 小说 亚洲 图片: 伦| 日本一区二区三区在线不卡| 日本一区视频在线观看| 久久精品国产**网站演员| 成人激情春色网| 亚洲三级黄色片| 亚洲精品国产精品久久| www.成人在线| 久久久久人妻精品一区三寸| 亚洲免费观看高清完整版在线观看| 亚洲欧美成人一区| 2023国产精品| 97人妻精品一区二区三区免| 中文字幕一区电影| 成年人视频免费| 欧美一区二区三区电影在线观看| 亚洲人精品午夜| 强行糟蹋人妻hd中文| 自拍偷拍亚洲一区| 国产酒店精品激情| 9191国产视频| 国产亚洲精品久久久久久777| 性猛交xxxx乱大交孕妇印度| 亚洲日本精品| 亚洲天堂av在线免费观看| 欧美高清69hd| 喜爱夜蒲2在线| 亚洲韩国欧洲国产日产av | 911亚洲精选| 这里只有视频精品| 午夜福利视频一区二区| 日韩毛片在线免费看| 日韩中文在线观看| 国产精品系列在线观看| 爱爱免费小视频| 国产精品久久久久久免费观看| 欧美视频一区二区三区…| 99热精品在线播放| 亚洲一区二区三区精品动漫| av动漫免费看| 欧美一区二区三区艳史| 亚洲人午夜精品天堂一二香蕉| 国产乱码久久久| 亚洲久久久久久久| 黄色激情在线视频| 91丨九色丨国产| 久久久久国产视频| 日韩视频免费直播| 亚洲综合成人在线| 狠狠久久亚洲欧美| 婷婷激情5月天| 97视频在线观看亚洲| 亚洲日本一区二区三区| 久热精品在线观看| 日韩a∨精品日韩在线观看| 中文字幕亚洲无线码a| 亚洲丝袜制服诱惑| 欧美 日韩 国产 在线| 日本xxxx裸体xxxx| 久久免费一级片| 国产v综合v亚洲欧美久久| 欧美视频一区二区在线观看| 国产精品77777竹菊影视小说| 色天使在线视频| 亚洲乱码日产精品bd在线观看| 久久久久久尹人网香蕉| 国产日韩欧美一区二区三区四区| 国产成人综合av| 国产精品成人无码专区| 亚洲成人你懂的| 亚洲爆乳无码专区| 国产亚洲精品bt天堂精选| 亚洲国产中文字幕| 亚洲精品97久久| 热久久视久久精品18亚洲精品| 国产在线观看一区| 国产男女在线观看| 蜜臀av无码一区二区三区| 97超级碰在线看视频免费在线看| 五月天婷婷色综合| 国产精品熟女久久久久久| 91免费观看国产| 欧美日韩成人精品| 911精品国产一区二区在线| 91视频免费在线| 午夜久久久精品| 国产精品911| www.com毛片| 伊人一区二区三区| 国产成人美女视频| 美女一区二区三区| 欧美日韩国产精品成人| 国产精品视频网| 韩国三级视频在线观看| 久久综合影视| www.欧美日韩| 中文字幕av一区二区三区谷原希美| 亚洲最大成人网站| 久久国产乱子伦精品| 国产亚洲综合性久久久影院| 欧美一区第一页| 欧美影院久久久| 波多野结衣在线网址| 欧美老女人在线| 亚洲一区二区四区| 蜜桃91麻豆精品一二三区| 91人人澡人人爽| 精品人妻av一区二区三区| 综合亚洲深深色噜噜狠狠网站| 国产一区二区三区在线免费观看 | 婷婷国产成人精品视频| 欧美在线 | 亚洲| 一区二区三区天堂av| 91网址在线观看精品| 9久久9毛片又大又硬又粗| 国产乱人伦偷精品视频不卡| 国产成人精品综合| 久久伊人蜜桃av一区二区| 性高潮免费视频| 亚洲精品在线电影| 91片黄在线观看喷潮| 亚洲性视频网址| 爱情岛论坛成人| 成人动漫一区二区三区| 18一19gay欧美视频网站| 日本爱爱爱视频| 日韩在线观看视频一区| 精品免费视频一区二区| 国产一级做a爰片在线看免费| 亚洲欧洲一区二区三区| 国产区欧美区日韩区| 欧洲成人一区二区三区| 亚洲男人的天堂在线观看| 成人在线视频网址| 在线观看黄网站| 一区二区三区在线播放欧美| 亚洲av熟女国产一区二区性色| 午夜免费久久看| 久久久久久九九九九| 欧美激情一区二区三区免费观看| 久久精品夜夜夜夜夜久久| 国产一级免费大片| 少妇高潮一区二区三区69| 久久久精品欧美| www.狠狠爱| 91av网站在线播放| 三级黄色在线观看| 日韩精品免费在线观看| 欧美国产精品一二三| 女人18毛片水真多18精品| 亚洲最大的成人网| 国产成人av电影在线| 麻豆三级在线观看| 91久久精品美女| 欧美α欧美αv大片| 六月丁香色婷婷| 青青在线视频一区二区三区| 激情六月天婷婷| 91美女在线视频| 日本在线视频不卡| 中文字幕免费不卡| 免费观看黄色的网站| 免费人成黄页网站在线一区二区| 国产97在线视频| 亚洲国产精品一区二区久久| 韩国日本美国免费毛片| 国产成人综合亚洲91猫咪| 男人插女人视频在线观看| av不卡免费在线观看| 99国产在线观看| 懂色一区二区三区免费观看| 亚洲av成人片无码| 亚洲一区二区四区| 国产啪精品视频| 在线精品视频免费播放| 久久久久国产精品一区三寸| 日韩福利视频| 国产成a人亚洲| 亚洲高清在线免费观看| 欧美三级电影网| 久久精品视频7| 日本在线观看一区| www.爱爱.com| 久久成年人视频| 韩国av免费观看| xxx欧美精品| 久久国产精品波多野结衣| 国产区亚洲区欧美区| 亚洲视频1区2区| 大尺度在线观看| 国产精品免费一区| 欧美本精品男人aⅴ天堂| 亚洲视频一区二区在线观看| 亚洲熟妇av日韩熟妇在线| 国产一区二区三区高清| 久久精品国产一区| 中文字幕精品一区| 国产交换配乱淫视频免费| 在线观看日韩av| 欧美aa在线视频| 亚洲国产一区二区精品视频| 日韩精品中文字幕一区 | 亚洲美女在线观看| 潘金莲一级黄色片| 亚洲人a成www在线影院| 久久久久亚洲AV| 日日骚一区二区网站| 欧美精品做受xxx性少妇| 91丝袜高跟美女视频| 免费看国产曰批40分钟| 欧美激情在线视频二区| 欧美日韩精品一区二区天天拍小说| 精品一区二区三区av| 亚洲自拍偷拍一区二区| 欧美大片第1页| 成人丝袜高跟foot| 亚洲第一视频区| 高清国语自产拍免费一区二区三区| 欧美日韩精品一区二区三区四区| 动漫美女无遮挡免费| 精品久久一区二区三区| 在线观看国产黄| 国内外成人激情免费视频| 欧美亚洲动漫精品| 成人aa视频在线观看| 亚洲精品无遮挡| 污片免费在线观看| 北条麻妃高清一区| 一区三区二区视频| 日本精品一区二区三区高清| 成人视屏免费看| 亚洲精品一区二区三区蜜桃| 一级片免费在线观看视频| 国产精品日本精品| 在线一区二区三区做爰视频网站| 亚洲在线精品视频| 免费一级片视频| 中国一区二区三区| 在线精品视频一区二区| 97久久久久久久| 日本三日本三级少妇三级66| 精品国产一二三区| 美女网站色91| 四虎永久在线观看| 久久久精品一区二区涩爱| 亚洲视频小说| 国产精品日韩欧美大师| 亚洲成人a级网| 伊人av综合网| 国产不卡在线观看| 国产精品一区二区久久精品| 亚洲第一男人av| 欧美性猛交xxxx黑人猛交| 精品无人区卡一卡二卡三乱码免费卡| 久操视频在线观看免费| 无码人妻aⅴ一区二区三区日本| 国产精品男人爽免费视频1| 欧美与黑人午夜性猛交久久久| 久久综合色天天久久综合图片| 小泽玛利亚一区| 国产男女免费视频| 亚洲xxxxx电影| 亚洲午夜激情免费视频| 国产精品久线在线观看| 久久久无码精品亚洲日韩按摩| 国产mv日韩mv欧美| 五月激情婷婷网| 中文无码精品一区二区三区| 国产农村妇女aaaaa视频| 国产精品成人网站| 亚洲国产成人一区二区| 国产精品资源站在线| 欧美高清hd18日本| 国产精品白嫩美女在线观看| 国产精品久久久久久久久借妻| 久久久久久久久久久亚洲| 精品久久久久久无| 欧美成人精品高清在线播放| 精品少妇一区二区三区在线视频 | 国产自产高清不卡| 毛片av中文字幕一区二区| 蜜桃av.com| 欧美激情一区二区三区p站| 国产日韩欧美大片| 97超级碰碰| 欧美亚洲日本黄色| 亚洲**2019国产| 国产一区二区视频在线观看| 91国产在线播放| 欧美一区二区三区免费视| 欧美性做爰毛片| 久久精品国产一区二区三区不卡| caopor在线视频| 美女精品一区二区| 亚洲男人天堂2019| 欧美a在线视频| 三级视频在线观看| 中文在线免费一区三区高中清不卡| 欧美亚洲禁片免费| 国产亚洲视频在线观看| 操91在线视频| 国产一区精品在线| 强开小嫩苞一区二区三区网站| 亚洲 欧美 另类人妖| 国产成人久久久久| www.国产毛片| 人妻丰满熟妇av无码区| 国产在线拍揄自揄拍| 日韩无码精品一区二区三区| 国产做受高潮漫动| 成人a v视频| 五月婷婷综合久久| 欧美日韩性生活视频| 神马国产精品影院av| 国产成人久久精品| 91精品黄色| 国产xxxxxxxxx| 中文字幕在线一| 一本到不卡精品视频在线观看| 精品久久久三级| 极品颜值美女露脸啪啪| 久久久久久97三级| 欧美一级久久久久久久大片| 午夜精品久久17c| 日本不卡一区| av电影一区二区三区| 五月婷婷六月合| 黄色一级视频在线观看| 2020国产精品| 日韩免费电影一区| 国产亚洲欧美aaaa| 国模叶桐国产精品一区| 国产欧美日韩专区发布| 综合操久久久| 国产精久久久久| 精品熟妇无码av免费久久| 国产一区二区三区四区五区入口| 午夜久久久影院| 成人有码视频在线播放| 91视频 - 88av| 中文字幕一区二区三区人妻电影| 性网爆门事件集合av| 91精品综合久久久久久| 日本精品免费视频| 中文字幕精品一区二| 欧美日韩五月天| 国产精品女人久久久久久| www.日本一区| 99精品中文字幕| 国产免费观看久久| 97在线视频一区| 天天色天天综合网| 久久成人综合网| 亚州男人的天堂| 亚洲成av人片| 欧美激情伊人电影| 视色,视色影院,视色影库,视色网 日韩精品福利片午夜免费观看 | 亚洲高清久久久久久| 亚洲精品成人三区| 99热这里只有精品5| 亚洲人成网站色在线观看| 精品视频一区二区三区免费| 91中文字幕在线观看| 欧美性猛交bbbbb精品| 在线亚洲高清视频| 无码人妻久久一区二区三区蜜桃| 亚洲一区欧美一区| 丰满少妇xbxb毛片日本| 懂色av一区二区三区| 无码专区aaaaaa免费视频| av不卡免费电影| 久久综合中文色婷婷| 国产小视频在线免费观看| 欧美日韩国产在线观看| 亚洲一区二区三区免费看| 国产剧情精品在线| 亚洲高清不卡av| 日韩欧美中文视频| 国产日韩欧美一区二区三区乱码| 久久国产精品免费一区| 久久精品无码一区二区三区毛片| 国产成人精品综合在线观看| 久久久久久久久久久网站| 婷婷综合在线视频| 欧美变态口味重另类| 国产激情视频网站| 99在线精品一区二区三区| 国产精品吊钟奶在线| 国产露脸无套对白在线播放| 久久偷看各类女兵18女厕嘘嘘| 国产美女免费网站|