A
AWS
July 11, 20251회
Amazon Bedrock을 이용해 Amazon Rufus 구현해보기

간단 소개
Amazon Bedrock을 활용하여 전용 LLM 없이 Rufus와 유사한 AI 쇼핑 어시스턴트를 구축하고 응답 시간을 최적화하는 방법론을 제시합니다.
AI Summary
- Amazon Rufus 소개 및 Bedrock 활용 배경
- Amazon Rufus는 생성형 AI 기반 쇼핑 어시스턴트로 속도에 최적화되어 있으며, 다양한 형식의 답변과 실시간 응답을 제공합니다.
- 전용 LLM 개발 없이 Amazon Bedrock을 활용하여 Rufus와 유사한 지능형 쇼핑 어시스턴트 구현 가능성에 대한 고민에서 시작되었습니다.
- Amazon Bedrock 기반 쇼핑 어시스턴트 구현
- Amazon Bedrock, DynamoDB, OpenSearch Service, API Gateway 등 다양한 AWS 서비스를 활용하여 쇼핑 어시스턴트를 구현합니다.
- 데이터 위치에 관계없이 API를 통해 접근 가능하다면 동일한 방식으로 구축할 수 있으며, 기존 시스템을 활용하면서 최신 생성형 AI 기술을 적용할 수 있습니다.
- 응답 시간 최적화 방법론
- **TTFT(Time To First Token)**와 **TPS(Tokens Per Second)**를 이해하고, tool 사용을 효율적으로 관리하여 LLM 호출 횟수를 줄입니다.
- 가용한 context를 미리 준비하고, Prompt caching을 활용하여 반복적인 컨텍스트 재사용 및 비용 절감을 통해 응답 속도를 향상시킵니다.
- 스트리밍 응답 구성 시 특수 토큰을 활용하여 텍스트와 상품 정보를 분리하고, 다음 대화 추천 기능을 통해 LLM 호출 없이 빠른 응답을 제공합니다.
Next Feeds

AI 코딩 어시스턴트 도입을 위한 완벽 가이드: 기술 트렌드 및 기업 사례 중심
AI 코딩 어시스턴트의 시장 동향, 주요 기술, 모델 비교, 활용 사례를 통해 도입 전략에 대한 인사이트를 제공합니다.
AI 코딩 어시스턴트LLM코드 자동 완성개발 생산성보안 점검
2025. 7. 11.
한글과컴퓨터

Amazon OpenSearch Service의 AI Search Flow를 활용한 손쉬운 AI 기반 검색 기능 구현
Amazon OpenSearch Service의 AI Search Flow 빌더를 사용하여 AI 기반 검색 기능을 손쉽게 구현하는 방법을 소개합니다.
OpenSearchAI Search FlowSemantic 검색멀티모달 검색RAG
2025. 7. 11.
AWS

전략적 QA와 리스크 관리: 장애를 예방하고 신뢰를 설계하는 품질의 힘
전략적 QA와 리스크 관리는 소프트웨어 품질 확보, 장애 예방, 그리고 기업 신뢰도 향상에 필수적이며, 전사적 협력이 중요합니다.
QA리스크 관리테스트 전략장애 대응품질 보증
2025. 7. 11.
한글과컴퓨터

코드 품질 개선 기법 17편: 사상누각
빌더 패턴 대신 생성자나 팩토리 함수를 사용하여 코드의 견고성을 높이고 가독성을 개선하는 방법을 제시합니다.
builder pattern생성자팩토리 함수코드 품질데코레이터 패턴
2025. 7. 11.
LY Corp

GPU를 밀도 있게 쓰는 방법 - 토스증권의 GPU 가상화(MIG) 도입기
토스증권의 GPU 가상화(MIG) 도입 사례를 통해 GPU 자원 효율성을 높이는 방법과 설정, 모니터링에 대해 설명합니다.
GPU가상화MIGKubernetesdcgm-exporter
2025. 7. 10.
토스

빗썸의 AWS Security Hub 및 AWS Step Functions을 통한 멀티 어카운트 보안 모니터링 및 자동화 시스템 구축
빗썸은 AWS Security Hub와 Step Functions를 활용하여 멀티 어카운트 보안 모니터링 및 자동화 시스템을 구축, 컴플라이언스 위반 사항에 대한 자동 조치를 구현했습니다.
AWS Security HubAWS Step Functions자동 조치컴플라이언스보안 모니터링
2025. 7. 10.
AWS