요
요기요
October 23, 20252회
요기요 카오스 엔지니어링 (1) 카오스 실험 시작하기

간단 소개
요기요가 카오스 엔지니어링을 도입하여 시스템 안정성을 검증하고, AWS FIS 사용 중 발생한 기술적 이슈를 해결한 경험을 공유합니다.
AI Summary
카오스 엔지니어링 소개
- 카오스 엔지니어링은 운영 시스템에 의도적으로 **장애(chaos)**를 주입하여 시스템의 안정성과 내구성을 강화하는 기법입니다.
- 넷플릭스는 Chaos Monkey와 Simian Army (Chaos Gorilla, Latency Monkey 등)를 통해 고가용성(HA) 및 자동 복구 아키텍처의 중요성을 입증했습니다. 요기요 카오스 실험 시작
- 대상 서비스는 사용자 멤버십 관리 서비스인 membership-yo, 실험 환경은 stage-integration으로 정의했습니다.
- 시나리오는 pod 네트워크 지연 및 외부 API 통신 장애로 설정하여 단계적으로 시스템 상태를 검증하고자 했습니다.
- 장애 주입 도구로 AWS FIS를 선정하고, latency, pod 개수, 5xx HTTP 상태코드 등을 주요 모니터링 지표로 정의했습니다. AWS FIS 사용 중 이슈 해결
- Istio service mesh 환경에서 FIS pod가 Kubernetes API server와 통신하지 못하는 문제가 발생했으며, Istio Proxy 주입 비활성화 Annotation으로 해결했습니다.
- FIS pod가 생성하는 임시 컨테이너의 root 권한 부족 문제가 발생하여, 실험 환경에 한정하여 root 권한을 임시로 허용하는 설정으로 해결했습니다.
Next Feeds

마케터를 돕는 LLM 기반 DMP - Seg Lens 시스템 개발기
SK플래닛이 마케터의 의도를 이해하고 최적의 타겟 세그먼트를 찾아주는 LLM 기반 DMP 'Seg Lens' 시스템을 개발한 사례를 소개합니다.
LLMDMPSeg Lens벡터 데이터베이스의미 기반 탐색
2025. 10. 23.
skplanet
if(kakao)25 - 카카오모빌리티의 랩업과 리뷰
카카오모빌리티가 if(kakao)25에서 자율주행, AI 기반 경로 탐색, HD MAP 자동화, AI 업무 자동화, AI 주소 자동 완성 등 핵심 기술과 비전을 공유했다.
카카오모빌리티if(kakao)25자율주행강화 학습AI
2025. 10. 22.
카카오모빌리티

Our Journey to Using Host Network in Kubernetes Pods
당근은 Kubernetes Pod의 Host Network 설정을 DaemonSet과 Job Pod에 적용하여 IP 주소를 절약하고 Pod 생성 속도를 개선했습니다.
KubernetesHost NetworkDaemonSetJob PodIP Address
2025. 10. 22.
당근
가맹점은 변함없이, 결제창 시스템 전면 재작성하기
토스페이먼츠가 20년 된 레거시 결제창 시스템을 가맹점 변경 없이 새로운 아키텍처로 전면 재작성하고, 안전한 전환 및 성능 최적화를 통해 비즈니스 요구사항 반영 속도를 획기적으로 개선한 여정.
레거시 시스템결제창아키텍처 재설계Canary 배포성능 최적화
2025. 10. 22.
토스

수많은 금융 상품 중에 선택받는 제품 만들기
토스뱅크가 굴비적금, 젤리 찾기 등 금융 상품을 성공적으로 만든 과정을 통해 콘셉트, 사용자 감정, 시각적 단서의 중요성을 설명합니다.
굴비적금젤리 찾기금융 상품UX 디자인콘셉트
2025. 10. 22.
토스

Amazon Bedrock Agent로 30분 만에 여행 예약 에이전트 구축하기 실전 가이드
Amazon Bedrock Agent를 활용해 DynamoDB, Lambda, S3, Knowledge Base를 연동하여 여행 예약 및 RAG 기반 상품 추천 기능을 갖춘 AI 에이전트를 30분 만에 구축하는 실전 가이드.
Amazon Bedrock AgentRAGLambdaDynamoDBKnowledge Base
2025. 10. 22.
AWS