Slash Your Gemini Bill Up To 75 %
- Gemini 2.5 모델에 새로운 '암시적 캐싱' 기능이 도입되어 토큰 비용을 최대 75%까지 절감할 수 있습니다. 💰
- 이 기능은 프롬프트의 접두사가 이전 요청과 동일할 경우 자동으로 캐싱을 적용하여 사용자가 별도의 설정 없이 비용 절감 혜택을 누릴 수 있게 합니다. ✨
- 명시적 캐싱과 달리, 암시적 캐싱은 복잡한 설정 없이 자동으로 작동하여 컨텍스트 창에 많은 정보를 미리 로드하고 후속 쿼리에서 비용을 절약하는 데 유용합니다. 🚀
- 암시적 캐싱은 Gemini 2.5 모델(Flash 및 Pro)에서만 지원되며, Flash 모델은 1,024 토큰 이상, Pro 모델은 2,048 토큰 이상의 접두사에서 캐싱이 활성화됩니다. 🧠
- 비디오와 같은 긴 컨텍스트를 프롬프트 앞에 배치하고, 이후 질문을 뒤에 추가하는 방식으로 비용 효율적인 프롬프트 구조를 설계하는 것이 중요합니다. 🏗️
- 현재 YouTube 비디오에 대한 암시적 캐싱은 지원되지 않지만, 일반 비디오 파일 업로드 및 캐싱은 가능합니다. 🎬
- 명시적 캐싱은 특정 콘텐츠를 장기간 확실하게 캐싱해야 하는 경우 여전히 유효한 옵션으로 남아 있습니다. 🛠️
- 이 기능은 비용 절감에 매우 효과적이므로, 사용자는 자신의 사용 사례에 맞게 구현하고 작동 여부를 확인하여 전체 비용을 줄여야 합니다. ✅
데브허브 | DEVHUB | Slash Your Gemini Bill Up To 75 %