新華社上海12月19日電(記者陳瀟雨)記者從上海交通大學獲悉,該校科研人員近日在新一代光計算芯片領域取得突破,首次實現了支持大規模語義媒體生成模型的全光計算芯片。相關成果12月19日發表于《科學》雜志。
據了解,隨著深度神經網絡和大規模生成模型迅猛演進帶來超高算力和能耗需求,傳統芯片架構的性能增長速度已出現嚴重缺口,光計算等新型架構受到廣泛關注。
“所謂光計算,可以理解為,不是讓電子在晶體管中運行,而是讓光在芯片中傳播,用光場的變化完成計算。光天然具備高速和并行的優勢,因此被視為突破算力與能耗瓶頸的重要方向。”論文作者、上海交大集成電路學院助理教授陳一彤表示,把光計算真正用到生成式AI上并不簡單,已有的全光計算芯片主要局限于小規模、分類任務,光電級聯或復用又會嚴重削弱光計算速度。如何讓下一代算力光芯片運行復雜生成模型,是全球智能計算領域公認的難題。
陳一彤課題組此次提出并實現了全光大規模語義生成芯片LightGen,采用極嚴格算力評價標準的實測表明:即便采用性能較滯后的輸入設備,LightGen仍可取得相比頂尖數字芯片2個數量級的算力和能效提升。團隊表示,LightGen之所以實現性能飛躍,在于其在單枚芯片上同時突破了“單片上百萬級光學神經元集成”“全光維度轉換”“不依賴真值的光學生成模型訓練算法”三項關鍵瓶頸,使得面向大規模生成任務的全光端到端實現成為可能。
據介紹,LightGen可完整實現“輸入—理解—語義操控—生成”的閉環,完成高分辨率(≥512×512)圖像語義生成、3D生成(NeRF)、高清視頻生成及語義調控,同時支持去噪、局部與全局特征遷移等多項大規模生成式任務。
“LightGen為新一代光計算芯片助力前沿人工智能開辟了新路徑,也為探索更高速、更高能效的生成式智能計算提供了新的研究方向。”陳一彤說。(完)



京公網安備 11011402013531號