亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

SGLang原生支持昇騰,新模型一鍵拉起無需改代碼

IP屬地 中國·北京 量子位 時間:2025-12-22 00:07:50

henry 發自 凹非寺
量子位 | 公眾號 QbitAI

當Agent在應用側不斷加速,推理系統能否承受隨之而來的真實負載,正在成為行業關注的焦點。

這是12月20日在杭州收官的SGLang AI 金融 π 對上,被反復提及的一個背景。



在這場聚焦大模型推理效率的“π對”上——

Agent的Vibe被暫時擱到一邊,真正擺上桌面的,是推理系統在真實負載中的工程問題:高并發請求長上下文窗口多輪推理內存管理,以及在具體金融agent場景下的一致性生成問題。

同時,在活動討論中,昇騰作為算力平臺也被多次提及。

當前,昇騰已作為SGLang原生支持的后端之一進入主倉庫,隨著 SGLang推理引擎的更新,DeepSeek、Qwen、GLM等模型可以在不調整模型參數、不引入額外插件的情況下直接運行,HiCache、Mooncake等系統能力也在對應版本中引入。

可以說,這次SGLang AI金融π對呈現的,并非零散技術點,而是一條清晰的推理工程演進路徑——從緩存與內存體系,到權重更新、強化學習效率,再到算力與模型生態的協同。

接下來,我們具體來看。

面向Agent的推理系統工程解法

這次SGLang活動由SGLangAtomGit社區聯合發起,于12月20日在杭州舉辦,活動圍繞大模型推理架構、Agent、強化學習及其在金融場景的落地展開討論。

在嘉賓方面,活動由來自推理系統、模型與算力一線的工程團隊共同參與,包括華為高級項目群總監薛曜,SGLang開發者黃章衡尚旭春,華為“小巧靈”突擊隊工程師荊升航,昇騰高級研發工程師鎮亮,以及GLM技術布道師張昱軒

整體來看,Agent相較于以往的問答式LLM,在深度研究、代碼生成、工具調用等應用以及強化學習訓練中,對高并發請求、長上下文窗口、多輪推理和內存管理的效率提出了更高要求。

而在特定的部署場景,如金融Agent中,則對低延遲、響應穩定性、一致性及成本控制的要求則更為嚴苛。

本次Meetup正是圍繞這些Agent原生的系統變化,給出了工程實踐層面的集中回應。

首先,針對高并發長上下文場景下KV cache重復計算、顯存需求大的問題。

SGlang通過最新引入的HiCache體系,將KV cache擴展到CPU和遠端存儲,由Cache Controller自動管理KV卸載填裝,并結合流水線化異步預取,顯著降低了顯存占用,提升了上下文推理的穩定性與吞吐。



此外,針對Qwen3-Next、Kimi Linear這類具備不同計算邏輯和內存管理方式的混合模型。

SGLang通過Mamba Radix Tree實現前綴統一管理,并借助Elastic Memory Pool彈性調度KV Cache與Mamba State,在長上下文、多并發場景下提供高效推理和顯存優化能力。

其次,為應對強化學習中策略權重頻繁更新導致GPU空轉、冷啟動耗時過長的瓶頸。

Mooncake基于Transfer Engine,采用異步預讀、pipeline并行設計,顯著壓縮權重加載和模型啟動時間,實現熱更新與彈性擴容。



實測效果顯示:Kimi K2萬億參數模型的權重更新準備時間被壓縮至20秒以內,63B模型的冷啟動時間更是從85秒降至9秒。

此外,由于強化學習rollout不再是一次性推理,而是異步、多階段、長度不可預測的過程。

換句話說,rollout中的長尾請求可能拖慢90%的訓練時間,甚至可能出現跑了一整夜仍未完成任何step的情況。

針對這一問題,SGLang通過Server化+全異步執行、oversample與 partial rollout機制控制長尾請求,大幅緩解Agentic RL中的長尾問題,提高了訓練效率。

最后,針對DeepSeek、GLM-4.5等MoE模型的fuse MoE、內存調度和負載均衡問題,SGLang持續重構執行路徑與內存管理機制。

同時,Slime強化學習系統針對大規模GRPO與多階段RL訓練定制,實現訓練系統與推理引擎的深度協同。



一個值得注意的細節是,這些推理系統級能力,并非只停留在某一類算力平臺上。這些實踐中的HiCache、Mooncake、GLM都均已能夠在昇騰平臺上直接運行,并進入實際推理流程。

而這些不約而同的支持,恰恰從側面印證了當前昇騰硬件在推理系統生態的角色轉變——

它已作為主流推理工作流中的后端之一,被自然納入系統設計與工程實現之中。

昇騰 × SGLang:大模型推理的高效實踐

在上述共性問題之下,活動中也展示了SGLang在昇騰平臺上的最新進展,覆蓋模型適配、性能優化及系統加速能力模塊化沉淀。

主要亮點如下:

模型優化:針對DeepSeek、Qwen系列等開源模型進行適配與性能提升,支持稠密、稀疏、多模態等架構,并支持Flux、Qwen-Image等多模態生成模型。系統特性:HiCache L1/L2/L3直通緩存機制已落地,MTP完全適配昇騰平臺,兼容GPU與NPU后端。量化能力:推進昇騰側量化與開源框架協同,支持壓縮張量等多種量化方案。推理模式:完善圖模式支持,實現DeepSeek V3.2、Qwen-Next、Longcat等新模型的day0支持。強化學習:支持SGLang VeRL等強化學習相關模型的推理與部署。



在具體的模型上,昇騰此次實現了對DeepSeek V3.2Day 0支持,在PD分離、64K輸入、3K輸出場景下,推理吞吐達15TPS / 卡,TTFT約4秒,PD傳輸(HCCS)< 8ms,TPOT ≈ 20毫秒。

為實現上述性能,團隊在系統層面進行了多項優化:負載均衡方面,通過重新分配計算任務,使各CP rank計算量均衡。

融合算子方面,減少計算過程中的內存訪問次數和Kernel啟動開銷。將多個連續的小算子合并為一個復合算子,使中間結果保留在高速緩存中,從而顯著提升計算效率。

多流并行方面,通過Cube與Vector計算單元并行執行算子,提升計算資源利用率。

同時,在Cube計算路徑中引入權重預取機制,實現數據搬運與計算階段的重疊,減少訪存等待帶來的性能損耗。

這些優化讓昇騰平臺在大規模、高復雜度推理場景中,實現了高吞吐、低延遲、資源高效利用的表現。



針對Qwen的優化則包括通用能力增強(圖模式、W8A8 量化、EAGLE3),為不同規模和形態等模型提供基礎性能支撐。

同時,引入昇騰親和性專項優化:利用多流并行,并在大EP(Expert Parallelism)場景中通過Dispatch/Combine流程將GMM計算融合處理,減少算子切換和中間調度開銷,提升整體執行效率。



除DeepSeek、Qwen外,SGLang在昇騰硬件上也已覆蓋KimiLongChat等模型,新模型可在不改代碼的前提下直接運行。

同時就像開頭所說的,這些模型的所有代碼均已合入SGLang主社區倉,開發者無需額外安裝插件,直接拉取主倉代碼即可使用。

昇騰表示這里的核心理念是盡量不動Models層,僅在底層完成硬件親和與性能提升

而這一系列進展背后,是昇騰與SGLang主倉的深度共建邏輯,也意味著AI算力與開源推理框架的融合進入新階段:

從架構層面看,昇騰相關優化已下沉到SGL-kernel-NPU算子庫,親和算子能力與代碼實現均在此集中維護演進。

Engine層作為核心優化區,支持EPLB、Graph Runner與MTP,覆蓋GPU與NPU等多硬件后端以實現統一推理能力。

緩存與通信則依托HiCache完成L1/L2及L3-L1直通優化,最底層的SGL-kernel-NPU則承載昇騰加速算子、量化算子及傳輸接口,實現開源能力與昇騰性能的雙向賦能。

整體來看,這些進展體現了昇騰與SGLang開源社區在推理系統層面的持續協同,也為后續更復雜推理與強化學習場景提供了穩定的工程基礎。

全面擁抱開源

在這次活動中,我們了解到,昇騰是今年七月份才正式啟動與SGLang的適配工作。薛曜表示,這一工作的目標很明確——全面擁抱開源、加速昇騰生態建設

在過去5個多月里,昇騰不僅補齊了多類主流模型的推理支持,還覆蓋了強化學習訓練、多模態理解與生成等關鍵場景,并在PD傳輸等系統層面持續優化,將SGLang on Ascend的整體性能推到了“可打”的水平

此外,據現場披露,昇騰已基于SGLang已在真實業務場景中,對DeepSeek V3.2完成了灰度測試。這意味著相關能力已不再停留在實驗或Demo階段,而是進入了真實生產環境的驗證周期。

從roadmap來看,昇騰接下來的演進方向也并非泛化擴展,而是明確圍繞“推理系統”展開的系統性工程投入

一方面,通過Zero Buffer、昇騰親和加速庫等機制,持續壓榨單機與多機推理吞吐,服務高并發、低時延的真實業務負載;

另一方面,在基礎軟件層構建昇騰版Triton生態,與SGLang、vllm等開源引擎保持接口與演進節奏對齊,使模型上線、算子開發與性能調優形成可復用路徑。

這些動作共同指向了一個清晰變化:昇騰不再只是“能否支持某個模型”的硬件選項,而是開始以推理系統為核心,被納入開源工程的主線討論與默認方案評估之中

當模型、推理引擎與算力平臺在工程層形成穩定協作,AI算力真正需要回答的問題,也將不再是“能不能跑”,而是“系統能不能長期跑、規?;⒎€定地跑”。

因為說到底,高性能、易用性、開箱即用才是真道理。

免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

日韩电影中文字幕一区| 久久精品国产亚洲精品| 国产精品视频资源| www.99r| 免费成人深夜夜行网站| 国产成人在线看| 色爱区综合激月婷婷| 久久在精品线影院精品国产| 四虎永久免费网站| 黄色国产在线播放| 国产乱码精品一区二区三区av| 亚洲一区二区不卡免费| 亚洲免费影视第一页| 成人毛片100部免费看| 无码一区二区三区在线| 成人性视频网站| 亚洲欧美一区二区三区久久| 正义之心1992免费观看全集完整版| 久久久久无码精品国产sm果冻| 久久精品国产**网站演员| 日韩欧美国产电影| 免费成人深夜夜行网站视频| 日本中文在线播放| 一区二区三区波多野结衣在线观看| 久久久人成影片一区二区三区观看| 正在播放一区二区三区| 久久99久久99精品免费看小说| 99久久综合99久久综合网站| 亚洲欧美国产视频| r级无码视频在线观看| jizz国产视频| 精品久久人人做人人爱| 精品一二三四五区| 五月天婷婷在线观看| 欧美日韩激情一区二区三区| 亚洲一区二区三区免费观看| 中文字幕人妻一区二区三区视频| 亚洲精品综合在线| 精品伦精品一区二区三区视频| 日本a级片视频| 欧美性高潮在线| 欧美精品一区二区三区在线看午夜| 亚洲天堂一级片| 91成人免费在线| 成人在线视频一区二区三区| 少妇一级淫片免费看| 伦伦影院午夜日韩欧美限制| 中国黄色片视频| 亚洲欧洲av一区二区三区久久| 国精产品一区二区| 91tv国产成人福利| 色偷偷av一区二区三区| 国产特级黄色录像| 欧美午夜激情视频| 黄页网站大全在线观看| 国产在线精品国自产拍免费| 国产精品久久激情| 日日摸天天添天天添破| 国产亚洲精品久久久久动| 亚洲午夜福利在线观看| 在线看国产一区| 亚洲精品www.| 国产v综合v亚洲欧| 亚洲影院在线看| 亚洲特级黄色片| 美女国内精品自产拍在线播放 | 日本免费在线视频不卡一不卡二| 日韩在线播放视频| 中文字幕第28页| 在线观看欧美日韩| 精品人妻中文无码av在线 | 视频一区二区国产| 亚洲999一在线观看www| 日日夜夜精品视频免费| 91麻豆国产精品| 天堂成人免费av电影一区| 亚洲在线一区二区| 天堂在线观看免费视频| 亚洲va电影大全| 激情综合五月婷婷| 亚洲精品一区二区三区av| 久久这里有精品| 国产在线视频不卡| 黄色激情在线视频| 国产精品你懂的| 国产91在线免费观看| 亚洲美女在线看| 91精品国产乱码久久| 欧美日韩天天操| 亚洲一区免费在线观看| 欧美性猛交xxxx乱大交少妇| 韩国19禁主播vip福利视频| 久久国产精品色婷婷| 日本a在线免费观看| 在线亚洲一区二区| 国产精品成人免费一区二区视频| 538国产精品视频一区二区| 国产精一品亚洲二区在线视频| 国产一区二区三区精彩视频 | 亚洲精品国产熟女久久久| 欧美成人一二三| 激情成人综合网| 蜜臀一区二区三区精品免费视频| 亚洲电影成人av99爱色| 亚洲一区在线观看免费 | 欧美精品一区二区三区蜜桃视频| 丰满少妇一级片| 男的插女的下面视频| 欧美一区二区视频在线观看2020| 中文字幕av免费观看| 欧美午夜精品久久久久免费视 | 三级在线视频观看| 亚洲免费中文字幕| 国产美女在线精品| 性生活在线视频| 久久久久久一区二区三区| 丁香婷婷综合色啪| 亚洲区免费视频| 亚洲一区二区三| 懂色av影视一区二区三区| 青青国产在线视频| 一区二区三区四区五区视频| 精品黑人一区二区三区久久| 免费人成网站在线观看欧美高清| 青青草原成人网| 最近更新的2019中文字幕| 国产精品正在播放| 亚洲精品国产精品国自产网站| 成人做爽爽免费视频| 欧美在线视频你懂得| 老妇喷水一区二区三区| 麻豆av免费观看| 91免费观看网站| 久久午夜电影网| 日韩三级免费看| 日韩 欧美 高清| 91久久精品日日躁夜夜躁国产| 91精品免费观看| caoporen国产精品视频| 国产精品自拍99| 国产97色在线 | 日韩| 国产欧美一区二区白浆黑人| 亚洲第一区中文字幕| 成人一级视频在线观看| 99热在线观看免费精品| 亚洲第一狼人区| 黄色国产精品一区二区三区| 亚洲欧洲午夜一线一品| 国产精品精品国产色婷婷| 少妇无套内谢久久久久| 乱码一区二区三区| 久久精品国产一区二区三区日韩 | 国产精品爽爽久久| 日韩片在线观看| 日本一道在线观看| 国产免费观看久久黄| 精品乱码亚洲一区二区不卡| 国产三级欧美三级日产三级99| 国产精品视频一二区| 国产美女免费网站| 日韩欧美国产综合在线| 国产精品一区二区av| 午夜剧场成人观在线视频免费观看| 在线播放视频一区| 国产女主播一区| 捆绑调教美女网站视频一区| 人妻熟妇乱又伦精品视频| caoporen国产精品| 欧美中文在线字幕| 一道本无吗dⅴd在线播放一区| 色婷婷av一区二区三区之一色屋| 国产精品日韩精品欧美在线| 国产综合久久久久影院| 性色av蜜臀av| 黄色在线免费观看| 麻豆av免费看| 久久国产成人精品国产成人亚洲| 欧美激情视频一区二区三区| 国产97在线|亚洲| 伊人久久久久久久久久久久久| 人人爽人人av| 国产福利久久精品| 庆余年2免费日韩剧观看大牛| 日韩精品在线视频美女| 欧美性xxxxx极品| 中文字幕在线不卡| 国产精品一二三四| 免费看日韩精品| 天天摸天天碰天天爽天天弄| 一区二区美女视频| 欧美brazzers| 日韩精品成人在线| 国产极品美女高潮无套嗷嗷叫酒店| www.色天使| 三级电影在线看| 91精品啪在线观看国产| yjizz视频| 美女脱光内衣内裤| chinese全程对白| 色婷婷在线视频观看| 国产美女www| 黄色aaa毛片| 国产一区二区三区四区五区入口| 激情五月播播久久久精品| 91污片在线观看| 亚洲第一在线综合网站| 欧美三级电影在线看| 亚洲美女视频网| 51色欧美片视频在线观看| 91av免费看| 中文字幕精品在线播放| 黄色一级片播放| 亚洲国产精品无码观看久久| 亚洲精品视频一区二区三区| 99高清视频有精品视频| 国产成人精品日本亚洲11| 国产精品久久7| 一区二区三区四区视频在线观看| 九色91在线视频| 中文字幕乱码一区二区三区| 91福利视频导航| 国产精品久久久久久婷婷天堂| 97国产一区二区精品久久呦 | 久久久久久久波多野高潮日日| 黑人乱码一区二区三区av| 日本亚洲免费观看| 26uuu国产日韩综合| 国产精品天天摸av网| 欧美性xxxxx| 69av一区二区三区| 日韩欧美国产电影| 精品国产欧美一区二区三区成人| 中文字幕一精品亚洲无线一区 | 91精品在线麻豆| 欧美精品一区二区三区视频| 一区国产精品视频| 亚洲精品美女在线观看| 久久久久久69| 国产精品v欧美精品v日韩| 欧美h视频在线观看| 给我免费播放片在线观看| 成年人网站av| xxxxx99| 韩国av中文字幕| 亚洲精品成人电影| 91美女片黄在线| 午夜精品久久久久久久| 亚洲福利在线观看| 日本高清久久天堂| 亚洲欧美日韩在线综合| 无码人妻丰满熟妇区毛片蜜桃精品| 色婷婷在线视频观看| 日本女人一区二区三区| 国产高清无密码一区二区三区| 一区二区三区在线视频观看 | av黄色在线网站| 亚洲 小说 欧美 激情 另类| 在线观看日本网站| 丰满人妻熟女aⅴ一区| 亚洲午夜羞羞片| 亚洲欧美一区二区精品久久久| 国产欧美一区二区| japanese在线播放| 亚洲色图日韩精品| 秋霞av亚洲一区二区三| 亚洲精品美国一| 久久手机免费视频| 狠狠色噜噜狠狠色综合久| 亚洲区 欧美区| 日韩欧美国产另类| 91蜜桃免费观看视频| 亚洲免费电影在线观看| 成人午夜在线影院| 夜夜爽久久精品91| 蜜臀av中文字幕| 亚洲网友自拍偷拍| 欧美一级片免费在线| 潘金莲激情呻吟欲求不满视频| 懂色av蜜臀av粉嫩av永久| 波多野结衣亚洲一区| 亚洲成色777777在线观看影院| 成人欧美一区二区三区在线| 任你操这里只有精品| 96日本xxxxxⅹxxx17| 日韩人在线观看| 欧美野外猛男的大粗鳮| 激情成人在线观看| 免费成人你懂的| 欧美日韩一区成人| 水蜜桃亚洲一二三四在线| 老女人性淫交视频| 国产一区二区三区久久久| 日韩情涩欧美日韩视频| 亚洲一区3d动漫同人无遮挡| 日本视频在线观看免费| 欧美日韩亚洲精品一区二区三区| 国产日本欧美一区| 破处女黄色一级片| 一区二区三区精品视频| 91中文在线视频| 国产午夜在线播放| 欧美日韩中文字幕综合视频| 成人精品一区二区三区电影免费 | 在线免费观看一区| 久草视频这里只有精品| 日本美女一级视频| 中文字幕免费国产精品| 在线观看av免费观看| 九色综合狠狠综合久久| 欧美高跟鞋交xxxxhd| 国产一级二级av| 国产精品人成在线观看免费| 亚洲最大福利视频网| 国产无码精品在线观看| 综合久久综合久久| 欧美精品欧美精品| 亚洲欧美高清视频| 久久精品91久久香蕉加勒比| av在线播放亚洲| 韩国精品久久久| 91高清视频免费观看| 久草福利资源在线| 成人一区二区在线观看| 91超碰在线免费观看| 69亚洲精品久久久蜜桃小说| 国产成人精品亚洲777人妖| 国产精品成人观看视频国产奇米| 久久久综合久久| 在线观看91精品国产麻豆| 亚洲a级黄色片| 国产精品久线在线观看| 亚洲色图都市激情| 成人手机在线视频| 欧洲精品久久| 日韩不卡一二三区| 国产主播在线一区| 天天干,夜夜爽| 欧美成人午夜激情在线| 日本免费在线播放| 亚洲性猛交xxxxwww| 国产一区第一页| 亚洲欧洲第一视频| 波多野结衣影院| 日韩欧美国产wwwww| 国产麻豆天美果冻无码视频| 岛国av一区二区三区| 少妇欧美激情一区二区三区| 亚洲精品国产精品乱码不99| 亚洲欧洲日韩精品| 91论坛在线播放| 特级西西人体www高清大胆| 亚洲国产高清aⅴ视频| 日韩一级片免费视频| 性做久久久久久免费观看欧美| 91高清国产视频| 好吊成人免视频| 全黄一级裸体片| 日韩欧美不卡在线观看视频| 大吊一区二区三区| 亚洲人成伊人成综合网久久久| 欧美黑人性猛交xxx| 久久偷看各类女兵18女厕嘘嘘| 欧美日韩精品在线观看视频| 夜夜嗨av色综合久久久综合网 | 欧美色区777第一页| 欧美另类69xxxx| 九九精品在线播放| 国产一区二区三区四区视频 | 中文字幕日产av| 国产精品自拍首页| 99九九99九九九视频精品| 不卡av免费在线| 精品国产人成亚洲区| 一区二区乱子伦在线播放| 啊v视频在线一区二区三区| 国产极品999| 精品乱子伦一区二区三区| 亚洲五月六月丁香激情| 欧美18—19性高清hd4k| 欧美—级高清免费播放| 精品一区二区三区的国产在线播放| 无码专区aaaaaa免费视频| 狠狠做深爱婷婷久久综合一区| 2021亚洲天堂| 国产精品黄视频| 国产精品家庭影院| 麻豆国产尤物av尤物在线观看 | 亚洲精品网站在线| 黄色成人在线免费观看| 亚洲国产精品人久久电影| 欧美 日韩 中文字幕| 日韩视频在线免费播放| 7777精品伊人久久久大香线蕉最新版| 黄色av网址在线观看| 国产精品久久久久久久9999| 中文字幕精品一区二区三区精品| 91精品国自产在线| 91免费福利视频| 一区二区三区免费网站| 日本在线播放视频| 一区二区视频在线免费| 91精品国产aⅴ一区二区| 最新国产中文字幕| 欧美一区二区中文字幕| 中文字幕久热精品视频在线| 九九久久精品视频| 国产白丝一区二区三区 | 一区二区在线观看免费视频播放| 国产5g成人5g天天爽| 国产日韩欧美夫妻视频在线观看|