IT之家 12 月 12 日消息,據通信產業網今日報道,中國電信研究院聯合中國科學院計算技術研究所、華為昇騰、沐曦等,依托中國電信云網融合技術中試驗證平臺,成功完成業界首個面向國產算力的跨架構大模型推理技術驗證。
中國電信研究院牽頭啟動“Triton 統一跨架構推理框架”技術攻關,通過自研 Triton 跨架構編譯器與統一大模型算子庫,實現同一套算子源碼在英偉達、昇騰、沐曦三類芯片上無縫運行。
本次技術驗證已完成 10 余款主流開源模型在三類芯片上的端到端推理測試,核心指標表現優異:
平均遷移時間≤3 天,較傳統適配模式效率提升超 80%;精度誤差 < 0.5%,確保模型推理可靠性;在同等延遲約束下,系統吞吐達到各芯片原生算子庫的 90% 以上,實現性能與適配效率的雙重優化。
此外,框架內置的 benchmark 與 Profiling 工具可一鍵生成跨芯性能對比報告,為業務方提供選芯決策支撐。
IT之家注:中國電信研究院是中國電信集團下屬研發機構,聚焦 6G、光網絡、衛星通信等領域核心技術攻關。





京公網安備 11011402013531號