谷歌在2025年I/O開發者大會上宣布了一項重大舉措,正式開源了專為醫療領域設計的AI模型——MedGemma。這款模型構建于先進的Gemma3架構之上,具備卓越的多模態圖像與文本處理能力,旨在助力醫療診斷與治療的效率提升。
MedGemma提供了兩種不同規模的配置供選擇:4B參數模型和27B參數模型。4B參數模型專注于醫療圖像的解析,能夠精準分類并生成詳盡的診斷報告,同時回答與圖像緊密相關的問題。而27B參數模型則側重于臨床文本的處理,尤其擅長患者分診和決策輔助,為醫生提供迅速且有價值的患者病情信息,便于制定高效的治療計劃。
4B模型在圖像編碼方面采用了創新的SigLIP技術,其預訓練數據集廣泛涵蓋了胸部X光、皮膚病學、眼科以及組織病理學等多個醫療領域,展現出在復雜醫療圖像處理方面的卓越性能。相比之下,27B模型憑借其龐大的270億參數,專注于深度解析醫療文本,為臨床推理提供有力支持,極大加速了醫務人員的決策過程。
為了滿足開發者的多樣化需求,谷歌提供了靈活的部署選項。開發者既可以在本地運行這些模型進行實驗,也可以通過谷歌云的Vertex AI平臺將其部署為HTTPS端點,實現大規模應用。谷歌還配備了豐富的資源,如Colab筆記本,以協助開發者進行模型的微調和集成工作。
谷歌積極鼓勵開發者針對特定應用場景對MedGemma進行驗證和微調,并提供了一系列指導和工具。開發者可以利用提示工程、上下文學習及LoRA等方法,高效地調整模型參數。這不僅使MedGemma成為一款前沿的AI工具,更成為了開發者和醫務人員在日常工作中提升效率的強大伙伴。