![]()
![]()
以開源生態打破國際壟斷,推動國產算力發展。9月12日,上海創智學院發布下一代大模型開源AI基礎設施——自主可控的強化學習框架siiRL 2.0與低比特訓練技術 Metis。
![]()
上海創智學院
該學習框架被譽為“下一代模型的動力引擎”,原生支持華為昇騰、沐曦等多款國產芯片,實現千卡級強化學習訓練,為國內首個突破,其完全分布式設計未來可擴展至萬卡集群,多模態和長上下文場景效率較主流框架快2-7倍。針對當前全球TOP模型中80% 未開源,siiRL以開源生態推動多智能體協同與深度認知能力發展,助力AGI技術普惠。
團隊還提出Metis框架,訓練過程的計算精度,接近無損的從fp32壓縮到fp4,首次揭示了大模型低精度訓練的問題根因進而提出了接近無損的大模型預訓練方法,為國產芯片指明并驗證了低比特訓練的路徑,未來芯片可以針對低比特高吞吐計算優化架構,在降低功耗和成本的同時提升國際競爭力。
據悉,學院還將于近日啟動“AI基礎設施開源周”,發布全鏈路技術棧,包括下一代訓練框架、推理引擎、萬卡集群通信庫與智能運維系統,持續推動國產算力生態建設。
記者獲悉,創智自主智算項目已建設超萬P智算集群,構建全球高校最大算力平臺之一,創立“建中研、干中學”機制引導學生深入算力建設一線,以開源開放為激勵導向,培養具備國際競爭力的AI基礎設施人才。
原標題:《開源技術棧賦能國產算力生態 創智學院發布全球領先AI基礎設施成果》
欄目編輯:王蔚
作者:新民晚報 易蓉





京公網安備 11011402013531號