阿里云推出全新AI計算解決方案：大模型所需GPU狂降82%！

IP屬地中國·北京 快科技 時間：2025-10-21 12:17:14

快科技10月21日消息，在近日于韓國首爾舉辦的頂級學術會議SOSP 2025（操作系統原理研討會）上，阿里云發布了其"Aegaeon"計算池化解決方案。
Aegaeon方案的核心在于解決AI模型服務中普遍存在的GPU資源浪費問題，尤其針對那些需求突發或不可預測的大型語言模型。
它打破了傳統的"一個模型綁定一個GPU"的低效模式，而是在Token級別虛擬化GPU訪問，這意味著單個GPU可以被多個不同模型共享服務，實現精細化的資源調度。
阿里云Aegaeon系統作為一種推理時間調度器，它能在每次生成下一個token后，動態決定是否切換模型，從而將微小的工作片段安排到共享池中。
通過組件復用、顯存精細化管理和KV緩存同步優化等全棧技術，Aegaeon將模型切換開銷降低了97%，確保了token級調度的實時性，可支持亞秒級的模型切換響應。
在阿里云模型市場為期超三個月的Beta測試中，Aegaeon系統在服務數十個參數量高達720億的大模型時，所需的NVIDIA H20 GPU數量從1192個銳減至213個，削減比例高達82%。
GPU用量的大幅削減，對于硬件采購成本高昂的大型模型服務商而言，意味著成本將顯著降低。
目前，這項核心技術已成功應用在阿里云百煉平臺。

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

馬斯克最新訪談：目標每年在太空部屬100吉瓦AI衛星

未來的iPhone，想靠衛星消滅無服務

2025中國國際石墨烯創新大會在溫州舉行多項關鍵技術取得突破

觀察|全固態電池商業化時間表成爭議焦點，高成本或阻礙推廣

IDC：印度手機市場Q3創五年新高，vivo、OPPO、三星位列前三

在全球最大的科技峰會現場，他們用DeepSeek養出迷你“獨角獸”

全站最新

馬斯克最新訪談：目標每年在太空部屬100吉瓦AI衛星

未來的iPhone，想靠衛星消滅無服務

2025中國國際石墨烯創新大會在溫州舉行多項關鍵技術取得突破

觀察|全固態電池商業化時間表成爭議焦點，高成本或阻礙推廣

熱門推薦

馬斯克最新訪談：目標每年在太空部屬100吉瓦AI衛星

未來的iPhone，想靠衛星消滅無服務

2025中國國際石墨烯創新大會在溫州舉行多項關鍵技術取得突破

創新是走出低谷、完成突破的動力（親歷者說）

線下線上齊發力，渝貨出山有實招

觀察|全固態電池商業化時間表成爭議焦點，高成本或阻礙推廣

IDC：印度手機市場Q3創五年新高，vivo、OPPO、三星位列前三

2025世界城市文化大會聚焦AI時代城市文化

在全球最大的科技峰會現場，他們用DeepSeek養出迷你“獨角獸”

潤和軟件與中國科學院廣州生物醫藥與健康研究院達成戰略合作

千問APP發布日遭美方“指控”，背后是中美AI的無聲戰爭

明年沖擊100萬臺！零跑汽車2025年銷量目標已達成

iPhone Air開啟eSIM時代：國內廠商紛紛跟進

劍指蘋果A20 高通驍龍8 Elite Gen6明年見：雙版本齊發

全球首發出圈實況拼圖！OPPO Reno15系列下周登場