微信公眾號“科創閔行”消息,北京時間12月19日,上海交通大學集成電路學院(信息與電子工程學院)圖像通信與網絡工程研究所陳一彤課題組在新一代算力芯片領域取得重大突破,首次實現了支持大規模語義媒體生成模型的全光計算芯片,相關研究以“All-optical synthesis chip for large-scale intelligent semantic vision generation”(大規模智能語義視覺生成全光芯片)為題發表于國際頂級學術期刊《科學》(Science)上。上海交通大學為論文第一作者和通訊作者單位,陳一彤助理教授為第一作者及通訊作者。
![]()
隨著深度神經網絡和大規模生成模型的迅猛演進,AI正以前所未有的速度革新世界。然而,規模爆炸式增長的生成模型帶來超高算力和能耗需求,與傳統芯片架構的性能增長速度已出現日益嚴峻的緊迫缺口。
![]()
為突破算力與能耗瓶頸,光計算等新型架構受到廣泛關注。然而如傳統的全光計算芯片主要局限于小規模、分類任務,光電級聯或復用又會嚴重削弱光計算速度。因此,“如何讓下一代算力光芯片能運行復雜生成模型”成為全球智能計算領域公認的難題。
研究團隊首次提出全光大規模語義生成芯片LightGen,這也是國際首次實現的大規模全光生成式AI芯片,在單枚芯片上同時突破了百萬級光學神經元集成、全光維度轉換、無真值光芯片訓練算法的領域公認瓶頸。
![]()
大規模全光生成計算芯片LightGen
論文實驗驗證了全光芯片LightGen在高分辨率(≥512×512)圖像語義生成、3D生成(NeRF)、高清視頻生成及語義調控、去噪、局部及全局特征遷移等多項大規模生成式任務。不再讓電輔助光生成,而是讓全光芯片完整實現輸入圖像、理解語義、語義操控、生成全新媒體數據的端到端過程,即讓光“理解”和“認知”語義。
![]()
LightGen生成的采樣圖像示例
此外,LightGen采用了極嚴格的算力評價標準,在實現與電芯片上運行的Stable Diffusion、NeRF、Style Injection Diffusion等前沿電子神經網絡相仿生成質量的同時,直接測量整個系統端到端的耗時與耗能降低。實測表明,即便采用較滯后性能的輸入設備,LightGen仍可取得相比頂尖數字芯片2個和2個數量級的算力和能效提升。而如果采用前沿設備使得信號輸入頻率不是瓶頸的情況下,LightGen理論可實現算力提升7個數量級、能效提升8個數量級的性能躍升。這不僅直接體現了在不損失性能情況下替換頂尖現有芯片能獲得的巨大算力和能效提升,也印證了解決大規模集成、全光維度變換、無真值光場訓練等關鍵難點,全光片上實現大規模生成式網絡的重要意義。
論文同步被《Science》官方選為高光論文重點報道。論文中提到,生成式AI正加速融入生產生活,要讓“下一代算力芯片”在現代人工智能社會中真正實用,勢在必行的是研發能夠直接執行真實世界所需任務的芯片——尤其是大規模生成模型這類對端到端時延與能耗極其敏感的任務。面向這一目標,LightGen為新一代算力芯片真正助力前沿人工智能開辟了新路徑,也為探索更高速、更高能效的生成式智能計算提供了新的研究方向。
陳一彤博士長期致力于光計算領域的研究,聚焦新一代算力芯片切實應用時的核心科學難點問題,團隊所提出的全模擬光電芯片ACCEL(Nature 623 (7985), 48-57),國際首次實測驗證了復雜智能任務中光計算的系統級算力優越性,將光計算芯片中的超高算力能效,無損地保留和接入復雜成熟的數字社會中。2023年,所提出的PED (Photonic Encoder Decoder,Science Advances 9(7), eadf8437)光計算架構,更被Science子刊認證為“國際首個全光生成網絡(PED is the first demonstration of all-optical generative neural networks)”。基于上述研究基礎,LightGen突破性將全光芯片的適用范圍拓展到了大規模生成式神經網絡,并已與工業界合作開展應用實踐。
上海交通大學集成電路學院(信息與電子工程學院)陳一彤助理教授擔任第一作者及通訊作者,翟廣濤教授、張文軍院士、博士生孫心玥,清華大學碩士生譚龍濤、博士生姜一洲、博士后周銀等均對本文做出重要貢獻。該研究得到了多項國家及上海市項目資助。





京公網安備 11011402013531號