騰訊云TencentOS Server AI，助力榮耀打造高性能AI底座

IP屬地中國·北京 編輯：沈瑾瑜砍柴網 時間：2025-06-09 19:03:27

隨著生成式AI技術的爆發式增長，AI大模型開始滲透至手機領域，一線廠商已經把AI應用集成到各自最新的產品中，并且在以驚人的速度迭代。為了進一步提升大模型部署的效能，榮耀基于應用騰訊云TencentOS Server AI中提供的TACO-LLM加速模塊部署DeepSeek-R1等開源大模型，并應用榮耀企業內部等場景，穩定性、可靠性、推理性能均大幅提升。
在推理平臺場景中，榮耀側重關注框架效能、穩定性、運行狀態監控及應急預案等特性。使用TACO-LLM進行推理任務后，在DeepSeek-R1 滿血版場景下，相對于榮耀原始線上業務性能，TTFT（首Token 延遲）P95 的響應時間最高降低6.25倍，吞吐提升2倍，端到端延遲降低100%。在社區最新版本sglang場景下，TTFT P95的響應時間最高降低12.5倍。
騰訊云TACO-LLM之所以能夠對榮耀業務的性能提升如此明顯，主要的得益于多種投機采樣技術核心能力：大語言模型的自回歸解碼屬性無法充分利用GPU的算力，計算效率不高，解碼成本高昂。而TACO-LLM通過投機采樣的方式，從根本上解決了計算密度的問題，讓真正部署的大模型實現“并行”解碼，從而大幅提高解碼效率。
榮耀大數據平臺部相關負責人表示：“榮耀使用騰訊云 TACO-LLM 打造高性能的AI底座，部署穩定可靠，提升了性能加速體驗。”
TencentOS Server AI加速版中提供的TACO-LLM加速模塊，針對企業級AI模型私有化部署挑戰，對大語言模型業務進行了專門的內核運行優化，用于提高大語言模型的推理效能，提供兼顧高吞吐和低延時的優化方案，能夠“無縫”整合到現有的大模型部署方案中。

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

放棄吧！“高速全面取消收費”根本沒戲，免費只會更痛苦

八部門：進一步加大力度促進汽車消費促進汽車梯次消費、更新消費

新車難用滿十年：技術短板、消費文化與行業策略如何共同“縮短”壽命

山東青島：“微醺巴士”開拓文旅消費新場景

牛市就到這了？

拉布布暑期降溫，中國潮玩出海彎道超車，誰是下一個頂流IP

全站最新

2025年流星雨迎來謝幕演出小熊座流星雨22日極大

鴻蒙正奔騰！解碼中國自主操作系統的生態成熟好用的極限突圍

我國成功發射通信技術試驗衛星二十三號

寶馬3系全球產量突破1800萬輛，50年傳奇仍在繼續

熱門推薦

放棄吧！“高速全面取消收費”根本沒戲，免費只會更痛苦

八部門：進一步加大力度促進汽車消費促進汽車梯次消費、更新消費

新車難用滿十年：技術短板、消費文化與行業策略如何共同“縮短”壽命

山東青島：“微醺巴士”開拓文旅消費新場景

牛市就到這了？

拉布布暑期降溫，中國潮玩出海彎道超車，誰是下一個頂流IP

南城香創始人汪國玉：平臺消費券激發消費熱情，門店收入利潤均提升

通信企業：“推銷熱售后冷”消磨用戶信任

盛銀消金 25% 股權再被凍結！新董事長年初剛上任

伊利出席第八屆中澳工商界首席執行官圓桌會助力中澳經貿合作提速升級

商查平臺企業信息查詢新范式：水滴信用企業查詢MCP

從“閃購”到“觀望”：Prime Day被拉長的背后，是消費者與平臺的“雙重博弈”

澎湃漫評｜通信企業為何“推銷熱售后冷”

“電商西進”助力豫企破浪：一枚魚油的3000公里“暖心”之旅

京東外賣取消超時免單，改為“準時寶”服務