智快網 - 新科技與新能源行業網絡媒體

          谷歌Gemini 2.5 API新推隱式緩存功能,開發者成本有望大幅削減

             發布時間:2025-05-10 12:10 作者:柳晴雪

          近期,科技界傳來一則新動態,谷歌在其Gemini 2.5 API中引入了名為“隱式緩存”的新功能,旨在通過智能化手段降低開發者的成本。據科技媒體WinBuzzer于5月9日報道,這一創新技術能自動識別并重用API請求中的常見前綴,從而幫助開發者實現成本的大幅縮減,最高可達75%。

          具體而言,“隱式緩存”功能適用于Gemini 2.5系列中的Pro和Flash模型。該功能無需開發者進行任何手動配置,系統默認啟用,大大簡化了操作流程。它通過自動檢測并重用API請求中的重復前綴,有效提升了效率,降低了成本。

          值得注意的是,“隱式緩存”與谷歌早前在2024年5月推出的“顯式緩存”有所不同。后者需要開發者自行配置,而前者則完全由系統自動處理,不僅節省了成本,還顯著提升了用戶體驗。為了最大化隱式緩存的效果,谷歌建議開發者在構建提示詞時,將穩定且常見的內容置于開頭,隨后再添加用戶特定的變量內容。

          谷歌還指出,如果開發者在短時間內發送具有相似前綴的請求,將有助于提高緩存的命中率,進一步提升效率。不過,為了享受這一功能,開發者需要滿足一定的Token數量要求:Gemini 2.5 Flash模型需至少1024個Token,而Gemini 2.5 Pro模型則需至少2048個Token。

          為了幫助開發者更好地了解緩存的使用情況,谷歌在API響應中新增了“cached_content_token_count”字段。這一字段將顯示緩存Token的使用詳情以及優惠計費信息,讓開發者能夠清晰掌握成本節約的具體情況。

          盡管谷歌宣稱“隱式緩存”功能能夠帶來高達75%的成本節省,但實際效果仍需第三方進行驗證。同時,由于不同開發者的使用模式可能存在差異,因此具體節省的幅度也可能有所不同。

          谷歌并未完全放棄“顯式緩存”方案。作為可選方案,顯式緩存仍然支持Gemini 2.5及2.0模型,并允許開發者自定義緩存內容和生存時間(TTL,默認1小時)。這一靈活性使得開發者能夠根據自身需求選擇最適合的緩存方案。

           
           
          更多>同類內容
          全站最新
          熱門內容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數碼群

          精品在线一区二区| 久久久久久亚洲精品中文字幕| 日本午夜精品视频在线观看| 国产精品久久久久久福利| 久久精品视频99精品视频150| 96免费精品视频在线观看| 久久久久人妻一区精品色| 精品乱人伦一区二区| 囯产精品久久久久久久久久妞妞| 国产精品伦子一区二区三区| 久久精品中文字幕免费| 日韩精品无码免费专区网站| 精品亚洲国产成人| 亚洲精品制服丝袜四区| 日韩AV片无码一区二区不卡| 久久久精品久久久久久96| 无码精品久久久天天影视| 国产精品尹人在线观看| 四库影院永久在线精品| 午夜精品久久久久成人| 久久久久久久99精品国产片| 国产精品自在线拍国产电影| 国产剧情精品在线观看| 亚洲午夜精品一区二区麻豆| 久久精品亚洲精品国产色婷| 99精品国产在热久久| 日韩深夜福利视频| 国产视频精品免费| 日韩精品福利片午夜免费观着| 日韩精品一二三区| 中文字幕日韩在线观看| 国产一精品一AV一免费孕妇| 国产精品91在线| 久久精品国产99精品国产亚洲性色| 日韩精品亚洲专区在线影视 | 成人免费无码精品国产电影| 久久精品国产亚洲AV大全| 久久精品中文字幕免费| 久久成人精品视频| 最新国产乱人伦偷精品免费网站| 国产精品白丝喷水在线观看|