IT之家 12 月 20 日消息,谷歌于 12 月 18 日發布公告,宣布推出 FunctionGemma,是基于 Gemma 3 270M 微調的專用模型,目的是將強大的函數調用(Function Calling)能力引入手機等邊緣設備。
谷歌表示,隨著行業從單純的對話式接口轉向主動式智能體(Agent),開發者對模型本地執行任務的需求日益迫切。
FunctionGemma 正是為此而生,它不僅繼承了 Gemma 系列的輕量化優勢,更通過專項微調,讓邊緣設備(如智能手機和嵌入式系統)無需依賴云端算力,能夠精準理解用戶指令并調用相應功能。
與通用大模型不同,FunctionGemma 專為“定制化”設計。它既能與人類自然對話,也能生成結構化的函數調用代碼來指揮計算機。
在 Google 進行的“移動操作”(Mobile Actions)測試中,該模型展現了驚人的可塑性:未經微調的基礎版本準確率為 58%,而經過針對性微調后,其執行復雜指令(如“明天約午飯并添加到日歷”、“幫我把昨天拍的美食發給老媽”)的準確率躍升至 85%。

為了在算力和電池受限的邊緣設備上流暢運行,FunctionGemma 采用了極致的輕量化設計。它利用 Gemma 的 256k 詞表高效處理 JSON 數據和多語言輸入,大幅降低了延遲。
該模型目前已適配 NVIDIA Jetson Nano 等開發板及主流移動設備,甚至能作為“交通指揮官”,處理簡單任務并將復雜邏輯路由至更大的 Gemma 3 27B 模型。
為了降低開發門檻,谷歌為 FunctionGemma 構建了廣泛的生態支持。開發者現在即可通過 Hugging Face、Kaggle 下載模型,并利用 Unsloth、Keras 或 NVIDIA NeMo 進行微調。
在部署方面,該模型全面支持 LiteRT-LM、vLLM、Llama.cpp 和 Ollama 等工具。谷歌還同步發布了 TinyGarden 游戲演示和“移動操作”微調指南,展示了如何用自然語言控制虛擬農場或手機系統設置,幫助開發者快速構建屬于自己的私有化、低延遲端側智能體。IT之家附上演示視頻如下:
無論是“為明天的午餐創建一個日歷事件”、“將 John 添加到我的聯系人”還是“打開手電筒”,該模型都能解析自然語言并識別正確的操作系統工具來執行命令。
在這個互動小游戲中,玩家使用語音指令來管理一塊虛擬土地。例如,你可以說“在最上面一排種向日葵并澆水”,模型會將指令分解為具體的應用程序功能,例如針對特定網格坐標的“種植作物”或“澆水作物”。 使用自然語言解決有趣的物理模擬謎題,款游戲完全在用戶瀏覽器中本地運行,由 FunctionGemma 和 Transformers.js 提供支持。





京公網安備 11011402013531號