S
skplanet
October 17, 20252회
Chat DIC 프로젝트에서 AWS Bedrock Prompt Caching으로 성능 최적화하기
간단 소개
SK플래닛 Chat DIC 프로젝트가 AWS Bedrock Prompt Caching을 활용하여 LLM 응답 속도와 비용을 최적화한 사례.
AI Summary
Chat DIC 프로젝트 개요 및 문제점
- Chat DIC은 자연어 요청으로 DB 스키마 기반 SQL 쿼리를 생성하는 시스템.
- 초기에는 매번 전체 스키마 정보를 프롬프트에 포함시켜 토큰 수 증가, Throttling, 응답 지연 문제 발생. AWS Bedrock Prompt Caching 도입 및 작동 원리
- Prompt Caching은 반복되는 프롬프트 문맥을 캐시에 저장하여 모델 재계산을 줄이고 지연 시간 및 토큰 비용을 절감하는 기능.
- Cache Checkpoint로 프롬프트 prefix를 지정하고, TTL(Time To Live) 5분 내 캐시 히트 시 재설정.
- system 및 tools 프롬프트에 캐싱을 적용하여 DB 스키마 정보 재처리를 방지. 성능 최적화 결과 및 향후 계획
- Prompt Caching 도입 후 평균 응답 시간 ~29.3초에서 ~23.1초로 단축, Throttling 발생률 약 60% 감소.
- 시스템 리소스 부하 및 비용 절감 효과 확인.
- 향후 캐시 TTL 및 캐시 영역 세분화를 통한 사용자 맞춤형 로직 도입 계획.
Next Feeds

핀테크그룹의 GraphQL 기반 BFF와 프론트엔드 활용기
컬리 핀테크그룹의 GraphQL 기반 BFF 도입 배경, 기술 스택, 활용 사례 및 고려사항을 다루며, 프론트엔드 생산성 향상과 백엔드 의존성 감소 효과를 설명합니다.
BFFGraphQLApollo Client프론트엔드MSA
2025. 10. 16.
컬리

오늘도 엔지니어가 된다고 말했다 - 당근페이 이용내역 개편기
당근페이팀이 이용내역 화면 개편을 위해 서버 드리븐 UI의 한계를 극복하고 GraphQL을 도입하여 안정성과 확장성을 확보한 경험을 공유합니다.
GraphQL당근페이서버 드리븐 UI클라이언트 주도스키마 설계
2025. 10. 16.
당근

있었는데요, 없었습니다.
SSG.COM이 자동발주 예측 품질 개선을 위해 권고발주를 자동발주로 전환하고, TFT 모델과 Quantile Forecasting을 도입하여 품절률을 크게 낮춘 과정을 설명합니다.
수요예측자동발주품절률머신러닝TFT
2025. 10. 16.
SSG
20년 레거시를 넘어 미래를 준비하는 시스템 만들기
토스페이먼츠가 20년 레거시 PG 시스템을 인수하여 9단계에 걸쳐 현대화하고, 미래를 위한 기술 혁신을 이룬 여정.
레거시 시스템MSAKubernetesDevOps보안
2025. 10. 16.
토스

휴먼의 AI '학습'은 이렇게! #1 - OpenAI Academy 사이트 톺아보기
OpenAI Academy는 GPT-5 등 OpenAI 서비스 활용법을 배우는 MOOC 형태의 공식 AI 학습 플랫폼으로, 다양한 직무별 맞춤형 콘텐츠를 제공한다.
OpenAI AcademyGPT-5AI 학습MOOCBuilders
2025. 10. 16.
skplanet
주소 데이터 활용을 위한 지번 주소와 도로명주소 주소 체계 이해하기
지번주소와 도로명주소 체계의 특징, 구성 요소, 그리고 데이터 활용을 위한 코드 구조를 설명한다.
지번주소도로명주소주소 코드위치 기반 서비스데이터 표준화
2025. 10. 15.
카카오모빌리티