日本精品一区二区三区高清 久久

ITBear旗下自媒體矩陣:

谷歌Gemini 2.5 API新推隱式緩存功能,開發者成本有望大幅削減

   時間:2025-05-10 12:10:33 來源:ITBEAR編輯:快訊團隊 IP:北京 發表評論無障礙通道

近期,科技界傳來一則新動態,谷歌在其Gemini 2.5 API中引入了名為“隱式緩存”的新功能,旨在通過智能化手段降低開發者的成本。據科技媒體WinBuzzer于5月9日報道,這一創新技術能自動識別并重用API請求中的常見前綴,從而幫助開發者實現成本的大幅縮減,最高可達75%。

具體而言,“隱式緩存”功能適用于Gemini 2.5系列中的Pro和Flash模型。該功能無需開發者進行任何手動配置,系統默認啟用,大大簡化了操作流程。它通過自動檢測并重用API請求中的重復前綴,有效提升了效率,降低了成本。

值得注意的是,“隱式緩存”與谷歌早前在2024年5月推出的“顯式緩存”有所不同。后者需要開發者自行配置,而前者則完全由系統自動處理,不僅節省了成本,還顯著提升了用戶體驗。為了最大化隱式緩存的效果,谷歌建議開發者在構建提示詞時,將穩定且常見的內容置于開頭,隨后再添加用戶特定的變量內容。

谷歌還指出,如果開發者在短時間內發送具有相似前綴的請求,將有助于提高緩存的命中率,進一步提升效率。不過,為了享受這一功能,開發者需要滿足一定的Token數量要求:Gemini 2.5 Flash模型需至少1024個Token,而Gemini 2.5 Pro模型則需至少2048個Token。

為了幫助開發者更好地了解緩存的使用情況,谷歌在API響應中新增了“cached_content_token_count”字段。這一字段將顯示緩存Token的使用詳情以及優惠計費信息,讓開發者能夠清晰掌握成本節約的具體情況。

盡管谷歌宣稱“隱式緩存”功能能夠帶來高達75%的成本節省,但實際效果仍需第三方進行驗證。同時,由于不同開發者的使用模式可能存在差異,因此具體節省的幅度也可能有所不同。

谷歌并未完全放棄“顯式緩存”方案。作為可選方案,顯式緩存仍然支持Gemini 2.5及2.0模型,并允許開發者自定義緩存內容和生存時間(TTL,默認1小時)。這一靈活性使得開發者能夠根據自身需求選擇最適合的緩存方案。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  RSS訂閱  |  開放轉載  |  滾動資訊  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 扎赉特旗| 夏河县| 白银市| 托里县| 宜宾县| 秦皇岛市| 衢州市| 邯郸县| 海南省| 顺平县| 新巴尔虎左旗| 永康市| 虹口区| 隆昌县| 张掖市| 乌兰县| 卢氏县| 东阿县| 镇远县| 华亭县| 南部县| 台北县| 荣昌县| 济阳县| 邓州市| 罗城| 建始县| 牟定县| 玉山县| 隆德县| 邵武市| 建昌县| 泽普县| 金塔县| 定西市| 咸宁市| 乌拉特前旗| 日土县| 昌邑市| 金乡县| 丰原市|