環球網
11月28日消息,聯想萬全異構智算研發團隊的論文《RNL: RoCE Network Loadbalance with AI Traffic Characteristics and link Congestion Awareness》于近日被IEEE CyberSciTech 2025大會收錄。
此次聯想被收錄的論文提出了一項創新性的RNL技術,通過多維感知、路徑負載均衡優化與增量流量遷移,有效解決了AI訓練與推理場景中RoCE網絡負載均衡的長期難題。
據悉,聯想萬全異構智算研發團隊創新性提出的RNL技術,可以構建“多維感知+路徑負載均衡+增量遷移”閉環體系,兼具算法創新與實用價值:首先是多維感知機制,可以實時感知網絡拓撲結構、AI任務網絡需求及RoCE鏈路負載狀態,為動態調度提供數據基礎。其次是路徑負載均衡優化,通過虛擬-物理網絡映射與路徑評分算法,智能選擇最優數據傳輸路徑,最大化帶寬利用率。第三是增量流量遷移,該技術采用增量遷移策略,在鏈路流量調整時避免瞬時延遲,確保業務連續性。
與傳統方案不同,RNL基于通用RoCE交換機實現AI網絡優化,無需綁定專用硬件,顯著降低了部署成本。其核心創新在于融合AI業務通信帶寬與時延評估算法,結合多維鏈路擁塞評估機制,實現對AI負載的精準調度與網絡路徑的智能編排。
在實測環境中,RNL技術不僅展現出高可靠性,更體現出在提升AI業務效率與降低總擁有成本(TCO)方面的雙重優勢。在性能提升方面,集合通信原語性能提升50%,帶寬利用率達85%,負載均衡離散度降低90%;AI推理場景下,TPS(每秒處理事務數)提升26%,TTFT(首字節時間)時長減少 30%,TPOT(每輸出令牌時間)時長減少 22%;整體部署成本降低60%,為AI集群的規模化落地提供了經濟高效的網絡基礎。
![]()
目前,RNL技術已納入聯想萬全異構智算平臺的落地規劃,這將進一步鞏固聯想萬全異構智算平臺在AI異構計算市場的技術壁壘,提升其行業影響力與核心競爭力。(青云)





京公網安備 11011402013531號