谷歌近日突然發布了Gemini 2.5 Pro的最新預覽版——Gemini 2.5 Pro Preview 06-05 Thinking,這一版本在多個關鍵領域的測試中展現出了卓越的性能,迅速引起了業界的廣泛關注。
據悉,Gemini 2.5 Pro Preview 06-05 Thinking在推理能力、科學以及編程能力等方面的測試中,超越了OpenAI的o3、DeepSeek R1和Claude Opus 4等競爭對手。特別是在編程能力測試中,該版本更是領跑Aider Polyglot等高難度編程基準測試,展現出強大的代碼生成和理解能力。
谷歌CEO桑達爾·皮查伊在海外社交媒體上親自宣布了這一消息,并表示:“我們最新的Gemini 2.5 Pro更新現已發布預覽版……我們聽取了用戶的反饋,并對回答的風格和結構進行了改進。用戶可以在AI Studio、Vertex AI平臺和Gemini app中進行試用。正式版即將推出!”
在基準測試中,Gemini 2.5 Pro Preview 06-05 Thinking全面領先,無論是文本、視覺、網頁開發、編程、數學、創意、多輪對話、指令跟隨還是長查詢類別,都取得了優異的成績。特別是在LMArena的綜合榜單中,該版本以顯著的優勢登頂,成為業界公認的頂尖智能模型之一。
盡管Gemini 2.5 Pro Preview 06-05 Thinking在某些特定測試上,如數學能力的AIME 2025、代碼生成的LiveCodeBench以及視覺推理的MMMU榜單上,尚未超越所有競爭對手,但其整體表現已經足以令人矚目。該版本的價格也相對實惠,為用戶提供了更具性價比的選擇。
自發布以來,Gemini 2.5 Pro Preview 06-05 Thinking已經吸引了眾多開發者和用戶的關注與體驗。在圖像生成方面,該版本能夠輕松生成生動逼真的照片和卡通動畫風格的圖像。在編程方面,它更是展現出了驚人的能力,能夠根據用戶的要求快速生成高質量的代碼。
谷歌此次推出的Gemini 2.5 Pro Preview 06-05 Thinking,不僅標志著大語言模型技術的新進展,也預示著AI行業的競爭將更加激烈。隨著大模型迭代周期的縮短和基準測試榜單的頻繁易主,AI較量已經進入了白熱化階段。而谷歌憑借Gemini 2.5 Pro的快速迭代和卓越性能,無疑將在這一競爭中占據有利地位。