5月21日,在2025年谷歌I/O開發者大會上,谷歌正式推出了一款端側多模態AI模型——Gemma 3n。該模型專為資源受限的設備設計,僅需2GB即可在、平板和上本地運行,支持處理音頻、文本、圖片和視頻等多種數據類型。

Gemma 3n基于Gemini Nano架構,其最大亮點在于采用了谷歌DeepMind開發的Per-Layer Embeddings(PLE)技術,這項技術顯著降低了模型的內存需求。盡管Gemma 3n的參數量高達5B和8B,但其內存占用僅相當于2B和4B模型,使得在內存小于2GB的設備上運行成為可能。Gemma 3n產品經理Gus Martins表示:“Gemma 3n為設備端AI應用帶來了驚人的表現力。”

除了PLE技術,Gemma 3n還集成了KVC共享和高級激活量化等技術,進一步優化了內存和計算效率。這些技術的應用使得Gemma 3n在移動設備上的響應速度提升了1.5倍,同時保持了優于Gemma 3 4B版本的質量表現。

Gemma 3n在非英語語言處理方面也取得了突破性進展,尤其在日語、德語、韓語、西班牙語和法語中表現優異。在多語言基準測試WMT24中,該模型得分高達50.1%,展現了其強大的多語言處理能力。
用戶無需進行任何設置,即可通過Google AI Studio在瀏覽器中直接使用Gemma 3n。對于開發者而言,他們可以通過Google AI Edge將Gemma 3n的本地功能集成到自己的應用中,支持文本和圖像的理解與生成。未來,Gemma 3n還將擴展更多能力,為開發者提供更強大的工具。





京公網安備 11011402013531號