近日,上海巖芯數智人工智能科技有限公司(以下簡稱RockAI)的Yan架構大模型成功通過生成式人工智能服務管理暫行辦法備案,這是國內首個非Transformer架構大模型通過備案。

Yan模型簡介
Yan架構大模型是國內首個非Transformer架構、非Attention機制的大模型。傳統的Transformer架構和Attention機制對算力要求較高,而Yan架構大模型以MCSD、類腦激活機制為基礎原理,大幅提升模型性能與效率,以3B參數量可達到Llama3 8B的水平,還可在CPU上運行部署。MCSD架構具有快速訓練、推理能力,實現更高效的特征提取,類腦激活機制則模擬大腦中的神經元激活模式,在計算時選擇性激活部分參數,減少算力冗余,更高效地解決問題。Yan架構大模型在保證性能的同時,有效降低了對算力的依賴。這不僅有助于提高模型的運行效率,還能降低成本,為更多企業和開發者提供了觸手可及的AI解決方案。
備案通過的價值
因此,Yan架構大模型通過備案對于RockAI以及行業發展均具有重要價值。
· 為行業發展開辟新的技術路徑
作為國內首個非Transformer架構、非Attention機制大模型完成網信辦備案,為行業發展開辟了新的技術路徑。
· 證明非Transformer技術路線的潛力
證明在算力受限的情況下,非Transformer架構技術路線的可行性和潛力,從而能夠鼓勵更多企業探索多元化的技術發展方向。
· 業內唯一一家同時擁有雙機制模型
RockAI成為唯一一家非Attention機制大模型和Attention機制大模型均備案通過的廠商,彰顯了其在AI技術研發方面的創新能力。
Yan落地情況
技術突破之外,商業落地層面Yan架構大模型也取得了顯著成果。依托低算力要求、本地部署、無損運行等優勢,RockAI已與機器人、無人機、手機、電腦等領域的設備廠商建立深度合作,并在上述領域落地多個項目。
RockAI在大模型領域以“群體智能”的理念構建通用人工智能技術,以“讓世界上每一臺設備擁有自己的智能”為使命,致力于打造群體智能單元大模型,實現AI普惠。Yan架構大模型的備案通過是RockAI踐行使命的重要里程碑,未來,我們期待Yan架構大模型在更多設備單元部署應用,讓群體智能引領走向通用人工智能,與合作伙伴一起,領先一步開拓更加廣闊的市場空間。





京公網安備 11011402013531號