在人工智能領域,一場關于編程模型的新變革正在悄然發生。谷歌DeepMind AI研究部門于近日震撼發布Gemini 2.5 Pro “I/O”特別版,這一舉動不僅回應了開發者社區對于高效編程與界面設計的迫切需求,更為全球用戶帶來了前所未有的體驗。
據最新消息,自ChatGPT在2022年底掀起生成式AI的狂潮以來,谷歌此次在關鍵的編程基準測試中成功超越了Claude,實現了歷史性的突破。新版模型,代號“Gemini-2.5-pro-preview-05-06”,已全面取代舊版,用戶現在可以通過Gemini API、Vertex AI、AI Studio等平臺輕松獲取,而普通用戶則能在Gemini聊天機器人應用中率先體驗。
在定價方面,Gemini 2.5 Pro “I/O”特別版延續了與前代相同的策略,每百萬token的輸入和輸出費用分別為1.25美元和10美元(約合人民幣9元和72元),并支持20萬token的上下文處理。相比之下,Anthropic的Claude 3.7 Sonnet模型的價格為3美元和15美元(約合人民幣22元和108元),顯然,Gemini 2.5 Pro在性價比上更具優勢。
谷歌DeepMind的首席執行官戴密斯·哈薩比斯對Gemini 2.5 Pro “I/O”特別版給予了高度評價,稱其為“迄今為止我們構建的最強大的編程模型”。這一贊譽無疑為Gemini系列模型注入了更多的信心與動力。
在功能方面,Gemini 2.5 Pro “I/O”特別版對函數調用功能進行了重點優化,顯著降低了錯誤率并提升了觸發可靠性。據谷歌官方博客介紹,該模型在編程和構建交互式網頁應用方面的能力有了“顯著”提升,尤其在代碼轉換等任務上表現更為出色。在WebDev Arena Leaderboard基準測試中,Gemini 2.5 Pro Preview (05-06)以1419.95分的高分超越了Claude 3.7 Sonnet的1357.10分,成功登頂。
除了編程能力的顯著提升外,Gemini 2.5 Pro “I/O”特別版在視頻理解方面也展現出了卓越的性能。該模型在VideoMME基準測試中獲得了84.8%的高分,穩居榜首。該版本還驅動著Gemini移動應用中的Canvas畫布等核心功能,進一步提升了用戶體驗。
Gemini 2.5 Pro “I/O”特別版在根據單條文本提示生成完整交互式網頁應用或模擬程序方面表現尤為突出。用戶只需輸入簡單的視覺圖案或主題提示,即可快速轉化為可用代碼,這一功能大大降低了設計導向型開發者的入門門檻。在Gemini 95等應用中,新模型能夠自動統一視覺元素的風格匹配,并支持將YouTube視頻轉化為功能完備的學習應用,生成高度風格化的組件,幾乎無需手動編寫CSS代碼。
隨著Gemini 2.5 Pro “I/O”特別版的發布,谷歌DeepMind正逐步將Gemini模型從研究性創新轉變為解決實際編程挑戰的生產力工具。這一轉變不僅滿足了開發者社區的迫切需求,更為谷歌在人工智能領域的市場地位奠定了堅實的基礎。