谷歌近日宣布推出一款名為FunctionGemma的新型專用模型,該模型基于Gemma 3 270M架構進行專項微調,旨在將強大的函數調用能力引入手機等邊緣設備。這一創新標志著行業從傳統對話式接口向主動式智能體轉型的重要進展,開發者對本地化任務執行的需求因此得到有力響應。
FunctionGemma的核心優勢在于其輕量化設計,繼承了Gemma系列的緊湊特性。通過專項優化,該模型能夠在智能手機和嵌入式系統等算力受限的設備上獨立運行,無需依賴云端服務。這種設計不僅降低了延遲,還顯著提升了邊緣設備的自主處理能力,使其能夠精準解析用戶指令并調用相應功能。
與通用大模型不同,FunctionGemma專注于“定制化”場景。它既能與用戶進行自然對話,又能生成結構化的函數調用代碼,直接指揮計算機執行任務。例如,在“移動操作”測試中,未經微調的基礎版本準確率為58%,而經過針對性優化后,執行復雜指令(如“明天約午飯并添加到日歷”或“將昨日拍攝的美食照片發送給母親”)的準確率提升至85%。
為了適應邊緣設備的算力和電池限制,FunctionGemma采用了高效的數據處理方式。它利用Gemma的256k詞表,能夠快速處理JSON數據和多語言輸入,進一步減少了運行延遲。這一特性使其在資源受限的環境中依然保持流暢性能。
在硬件適配方面,FunctionGemma已支持NVIDIA Jetson Nano等開發板及主流移動設備。它甚至可以作為“交通指揮官”,處理簡單任務,并將復雜邏輯路由至更大的Gemma 3 27B模型,形成分層處理架構。這種靈活性為開發者提供了更多應用場景的可能性。
谷歌為降低開發門檻,構建了廣泛的生態支持體系。開發者可通過Hugging Face、Kaggle等平臺下載模型,并利用Unsloth、Keras或NVIDIA NeMo等工具進行微調。在部署環節,該模型全面兼容LiteRT-LM、vLLM、Llama.cpp和Ollama等工具,進一步簡化了開發流程。
為了直觀展示FunctionGemma的能力,谷歌同步發布了TinyGarden游戲演示和“移動操作”微調指南。在游戲中,玩家通過語音指令管理虛擬土地,例如“在最上面一排種向日葵并澆水”。模型會將指令分解為具體操作,如針對特定坐標的“種植作物”或“澆水作物”。這款游戲完全在瀏覽器中本地運行,由FunctionGemma和Transformers.js提供支持,展現了自然語言處理在物理模擬中的潛力。
實際應用中,FunctionGemma能夠解析多種自然語言指令并識別正確的操作系統工具。無論是創建日歷事件、添加聯系人,還是打開手電筒,該模型都能快速響應并執行命令。這種能力為邊緣設備的智能化提供了新的解決方案,推動了端側智能體的普及。











