- Gemini 2.5 모델에서 암묵적 캐싱으로 토큰 비용을 최대 75% 절감 가능 💰.
- 명시적 캐싱은 장기간 재사용에 유리하며, 파일 API를 통해 비디오 파일을 업로드하고 캐시를 생성해야 함 📁.
- 암묵적 캐싱은 2.5 Flash 모델에서 1,024 토큰 이상, Pro 모델에서 2,048 토큰 이상일 때 자동 적용 ✨.
- 긴 시스템 프롬프트를 활용하여 모델의 응답 스타일을 제어하고, 캐싱 효과를 극대화할 수 있음 🧠.
- 현재 YouTube 비디오는 암묵적 캐싱이 지원되지 않지만, 향후 지원 가능성을 기대 🤞.