버
버즈빌
November 16, 20231회
RDS MySQL IOPS 장애 대응기

간단 소개
RDS MySQL IOPS 장애 대응 과정과 원인 분석, 스케일 업을 통한 해결 방법, 그리고 추가적인 개선 방안을 제시합니다.
AI Summary
- 장애 상황 및 원인 분석
- 퇴근 직전 user 서비스 에러율 증가, CPU throttle, 메모리 사용량 급증, MySQL replica connection 수 폭증 발생
- RDS 모니터링 결과, IOPS 증가로 burst balance 소진, DB 성능 저하
- storage 증설로 응급 조치 후, 높은 Disk I/O 원인 조사 착수
- 1년간 IOPS 추세 분석 결과, 2배 증가 및 높은 요청 대비 I/O 비율 확인
- 문제 해결 및 개선
- InnoDB Buffer pool hit ratio는 98%로 cache miss가 원인이 아님을 확인
- AWS 권장 사항에 따라 working set 크기 확보를 위해 RDS RAM 사이즈 스케일 업 결정
- m5.2xlarge에서 r6g.2xlarge, r6g.4xlarge로 인스턴스 타입 변경 및 메모리 확장 (32GB -> 61GB -> 128GB)
- 스케일 업 후 Read IOPS 감소, Freeable memory 증가, Read throughput 감소 효과 확인
- 추가 고려 사항
- DB 인스턴스 가격 상승에 따른 인덱스 사이즈 최적화 및 다운사이징 검토 필요
- DynamoDB 등 다른 스토리지 사용 시 성능/가격 비교를 통한 개선 가능성 모색
- Redis 캐시 추가는 시스템 복잡도 증가 및 장애 시 burst 발생 가능성으로 인해 보류
Next Feeds
스위프트 매크로_1탄, 스위프트 매크로가 뭐예요?
스위프트 5.9에 도입된 매크로 기능은 코드 자동 생성 및 재사용성을 높이며, 기존 기술의 단점을 보완한다.
스위프트 매크로코드 자동 생성컴파일 타임스위프트 패키지 매니저코드 스니펫
2023. 11. 15.
올리브영

타임라인으로 살펴본 2023 기술행사 후원 기록(KWDC, INFCON)
카카오뱅크가 2023년 KWDC, INFCON 기술 행사를 후원하며 브랜드 인지도를 높이고 개발자들과 소통한 경험을 공유합니다.
카카오뱅크기술 행사후원KWDCINFCON
2023. 11. 15.
카카오뱅크
사람인 백엔드 개발자에게 취업이란? (w/ 제로베이스)
사람인 백엔드 개발자의 취업 경험, 개발 문화, 그리고 개발자 취업 준비에 대한 조언을 담은 인터뷰.
백엔드 개발자취업사람인개발 문화기술 부채
2023. 11. 15.
사람인

CPU 이용률의 두 가지 얼굴 – CPU 코어 사용량(Usage)과 활용률(Utilization)
CPU 이용률의 두 가지 얼굴인 사용량과 활용률을 이해하고, 서버 성능 측정 및 최적화에 활용하는 방법을 설명합니다.
CPU 이용률CPU 사용량CPU 활용률성능 모니터링서버 최적화
2023. 11. 13.
넷마블
UI 테스트 자동화 구조
UI 테스트 자동화 시 페이지 객체 모델(POM)을 적용하여 유지보수성을 높이고, pytest를 활용한 테스트 구조를 소개합니다.
UI 테스트 자동화페이지 객체 모델POMpytest유지보수
2023. 11. 11.
올리브영
리디와 함께하는 CRM 여정
리디의 CRM 도입 여정과 성공 사례, 그리고 CRM 자동화 개발 과정 및 고려 사항을 분석합니다.
CRMBraze캠페인자동화데이터 분석
2023. 11. 10.
리디