A
AWS
June 9, 20251회
Amazon Bedrock에서 프롬프트 캐싱 효과적으로 사용하기

간단 소개
Amazon Bedrock의 프롬프트 캐싱 기능은 응답 시간 단축 및 비용 절감을 제공하며, 효과적인 사용법과 모니터링 방법을 제시합니다.
AI Summary
- 프롬프트 캐싱 소개
- Amazon Bedrock에서 프롬프트 캐싱을 통해 응답 지연 시간 감소 및 비용 절감 가능
- Claude 3.5 Haiku, Claude 3.7 Sonnet, Claude 4 Sonnet과 Opus, Nova Micro, Nova Lite, Nova Pro 모델 등 지원
- 프롬프트 캐싱 작동 방식
- 캐시 체크포인트를 사용하여 프롬프트의 정적 부분을 캐싱
- 동일한 프롬프트 접두사로 요청 시 캐시에서 읽어 입력 토큰 처리 시간 단축
- 정적 콘텐츠는 프롬프트 시작 부분에, 동적 콘텐츠는 끝 부분에 배치 권장
- 프롬프트 캐싱 활용 및 모니터링
- 문서 기반 챗봇, 코딩 어시스턴트, 에이전트 워크플로우, Few-shot 학습 등에 적합
- Amazon Bedrock 및 CloudWatch를 통해 캐시 히트율, 토큰 소비, 지연 시간 개선 등 모니터링
- **교차 리전 추론(CRIS)**과 함께 사용 가능하며, 비용 절감 효과 분석 필요
Next Feeds

구관이 꼭 명관은 아니다: 정산 시스템의 세대교체
29CM은 네이버쇼핑 수수료 정산 시스템을 Spring Boot 기반으로 재구축하여 성능, 확장성, 유지보수성을 개선했습니다.
정산 시스템Spring Boot레거시 시스템마이그레이션Spring Batch
2025. 6. 8.
무신사

더블유젯소프트(WZSOFT)의 미음 챗봇 도입기: AWS Bedrock 기반 AI 챗봇으로 뷰티샵 상담 자동화 하기
더블유젯소프트는 AWS Bedrock 기반 AI 챗봇을 도입하여 뷰티샵 상담을 자동화하고 운영 효율성을 향상시켰습니다.
Amazon BedrockAI 챗봇미음상담 자동화Action Group
2025. 6. 5.
AWS
![[현장으로 간 리서처] EP1. 커피값은 저희가 낼게요, 테스트 참여 해보실래요?](https://static.toss.im/assets/finance-tips/img-financetip-og2.png)
[현장으로 간 리서처] EP1. 커피값은 저희가 낼게요, 테스트 참여 해보실래요?
토스플레이스는 실제 매장에서 결제 단말기 UX 리서치를 통해 카드 할인 정보 인지 및 결제 행동 변화를 확인하고, 오프라인 테스트의 중요성을 강조했다.
토스플레이스프론트UX 리서치오프라인 테스트결제 경험
2025. 6. 5.
토스

토스 프론트엔드 챕터가 오픈소스를 통해 꿈꾸는 미래
토스 프론트엔드 챕터의 오픈소스 목표와 기술적 문제(Maximum call stack size exceeded) 발생에 대한 내용 요약.
토스프론트엔드오픈소스에러Maximum call stack size exceeded
2025. 6. 5.
토스

L7 DDoS 공격 패턴에 대응하는 WAF 규칙 설정하기 – JA3 및 JA4 핑거프린팅 집계 속도 규칙
AWS WAF와 JA3/JA4 핑거프린팅을 활용하여 L7 DDoS 공격에 효과적으로 대응하는 규칙 설정 및 분석 방법을 제시합니다.
AWS WAFDDoSJA3JA4Fingerprint
2025. 6. 5.
AWS

AWS Shield와 AWS WAF로 효과적인 DDoS 대응 방안 구축하기
AWS Shield와 WAF를 활용하여 DDoS 공격에 효과적으로 대응하는 방안을 아키텍처 및 설정 관점에서 설명합니다.
DDoSAWS ShieldAWS WAFSRTCloudFront
2025. 6. 5.
AWS