谷歌在2025年度的Google I/O開發者大會上,震撼發布了其最新的輕量級多模態AI模型——Gemma3n,并同時宣布Gemma模型家族迎來新成員,包括專為醫療領域設計的MedGemma和為無障礙溝通打造的SignGemma。
Gemma3n作為本地運行AI技術的先鋒,被精心打造以適應手機、筆記本和平板電腦等低算力設備的需求。它不僅能夠處理文本、音頻、圖像和視頻,而且據谷歌透露,即便在內存低于2GB的設備上,Gemma3n也能流暢運行,展現了其卓越的架構效率。這一模型在發布當日即對開發者開放預覽,并與Gemini Nano共享相同的底層技術架構。
谷歌著重指出,Gemma3n的輕便與隱私保護特性使其成為離線AI應用的優選。相較于依賴云端的大型模型,本地AI模型不僅響應速度更快、成本更低,還能確保用戶數據的安全,避免數據傳輸至遠程服務器,這對于隱私敏感的場景尤為重要。
在醫療健康領域,谷歌通過旗下的健康AI開發者基金會推出了MedGemma,這是一組專注于健康相關文本與圖像分析的開放模型。MedGemma具備出色的多模態分析能力,能夠幫助開發者在醫療影像識別、病歷文本處理等方面構建更加精準的AI解決方案。
谷歌還預告了SignGemma模型的推出,這款模型專為手語識別設計,能將美國手語(ASL)翻譯成英語文本。谷歌聲稱,SignGemma是目前為止最強大的手語理解模型,旨在助力開發者為聾啞和聽障用戶打造更友好的溝通工具。
盡管Gemma模型系列因其非標準許可條款引發了一些開發者對商業化應用的擔憂,但其多功能性依然受到了開發者社區的熱烈歡迎。據統計,Gemma模型系列的下載量已突破數千萬次。
隨著Gemma模型家族的持續壯大,谷歌正推動開放AI模型在設備端、本地隱私保護、醫療健康以及無障礙領域實現更廣泛的應用,為各行各業的發展注入新的活力。