L
LY Corp
February 21, 20251회
신뢰성 향상을 위한 SLI/SLO 도입 1편 - 소개와 필요성

간단 소개
SRE의 역할, SLI/SLO의 개념과 정의, 측정 방법, 그리고 오류 예산을 통한 리스크 관리 및 실제 운영 업무 활용 방안을 소개합니다.
AI Summary
SRE의 역할과 신뢰성 측정
- SRE는 서비스의 안정성과 신뢰성을 제공하는 엔지니어링 업무를 수행하며, 사용자가 믿고 쓸 수 있는 서비스를 제공하는 것을 목표로 합니다.
- **SLI(Service Level Indicator)**는 사용자 관점에서 서비스의 안정성을 판단하는 정량적 지표이며, **SLO(Service Level Objective)**는 SLI를 통해 달성해야 하는 목표 값입니다.
- **SLA(Service Level Agreement)**는 SLO를 기반으로 서비스 공급자와 고객 간의 계약을 의미합니다.
SLI/SLO 정의 및 활용
- SLI/SLO는 사용자 여정을 기반으로 정의되며, 핵심 사용자 여정(CUJ)을 파악하고 각 여정별 API를 찾는 것에서 시작합니다.
- SLI/SLO를 정의하고 측정할 때는 사용자 관점에서 바라보고, 최대한 단순하게 집계하며, 시스템 특성을 잘 나타내는 최소한의 SLO를 설정해야 합니다.
- **오류 예산(Error Budget)**은 SLO를 기준으로 허용 가능한 장애 또는 서비스 저하 수준을 정의하며, 개발팀이 리스크를 관리하고 신규 기능 개발과 안정성 확보 사이의 우선순위를 결정하는 데 도움을 줍니다.
SLI/SLO 운영 및 개선
- SLI/SLO를 활용하여 서비스 관련 이해관계자들이 신뢰성을 평가하고, 정기 회의를 통해 모니터링하며, 오류 예산을 기반으로 알림 체계를 구축할 수 있습니다.
- SLO 및 오류 예산 상태에 따라 대응 및 리소스 활용 정책을 정의하여 서비스의 신뢰성을 지속적으로 관리하고 개선해야 합니다.
Next Feeds

배포 자동화 툴 개발을 위한 AWX 활용
AWX를 활용한 배포 자동화 툴 개발 방법과 고려사항을 제시하고, 배포 자동화의 중요성 및 AWX의 장점을 강조합니다.
배포 자동화AWXAnsibleKubernetesDevOps
2025. 2. 21.
skplanet
테스트 자동화의 시작 - Cypress 기반 E2E 테스트 도입기
카카오모빌리티 웹 FE 개발팀의 Cypress 기반 E2E 테스트 도입 및 활용 사례, 그리고 테스트 자동화 전략을 소개합니다.
E2E 테스트Cypress테스트 자동화API Mockingtesting-library
2025. 2. 20.
카카오모빌리티

사용자 모르게 리멤버 UI icon 개선하기
리멤버 UI 아이콘을 사용자 인지 없이 개선하여 VOC 감소 및 제작 리소스 절감 효과를 얻고, 브랜드 가치를 UI에 자연스럽게 녹여냄.
UI icon리멤버Pretendard사용자 경험디자인 시스템
2025. 2. 20.
리멤버
MongoDB WiredTiger의 B+Tree
MongoDB WiredTiger의 B+Tree 구조, 리프 페이지 관리 방식, InnoDB와의 비교 분석을 통해 데이터 관리 방법을 심층적으로 설명합니다.
MongoDBWiredTigerB+TreeInnoDBMVCC
2025. 2. 20.
카카오
VM Blue-Green 전환으로 효율적인 개발 환경 만들기 (feat. Property 주입)
VM Blue-Green 전환과 Property 주입을 통해 CI/CD 효율성을 높이고 개발 환경을 개선한 경험 공유.
Blue-Green 배포CI/CDProperty 주입DockerSpring Boot
2025. 2. 19.
현대자동차
카나리 배포 도입과 상품 유닛의 쓱데이 대응기
쓱데이 대응을 위한 카나리 배포 도입 배경, 활용 방법, 그리고 실제 적용 사례를 통해 얻은 교훈을 공유합니다.
카나리 배포쓱데이상품 유닛트래픽Java 21
2025. 2. 19.
SSG