L
LY Corp
February 28, 20251회
신뢰성 향상을 위한 SLI/SLO 도입 2편 - 플랫폼 적용 사례

간단 소개
LINE 미디어 플랫폼 OBS에 SLI/SLO를 도입하여 신뢰성을 향상시킨 사례와 기술적 해결 과정을 공유합니다.
AI Summary
- 미디어 플랫폼 OBS의 SLI/SLO 도입 배경
- LINE 서비스의 핵심인 미디어 플랫폼 OBS의 신뢰성 확보가 중요.
- 서비스가 아닌 플랫폼 자체에 SLI/SLO를 정의하여 문제 발생 시 즉각적인 대응 가능.
- 다양한 LINE 서비스에 미치는 영향력을 고려, 별도 SLI/SLO 설정.
- CUJ 정의 및 메트릭 수집
- 주요 API(DOWNLOAD, UPLOAD, OBJECT_INFO)를 CUJ로 설정, 각 기능별 SLI/SLO 정의.
- 가용성, 처리량, 대기 시간 등을 SLI로 활용하되, 서비스별 편차를 고려하여 처리량은 참고 지표로 활용.
- Kafka, Vector, Prometheus, Grafana를 이용한 메트릭 수집 아키텍처 구축.
- Vector 최적화 및 Recording Rules 적용
- 대량의 로그 처리 문제를 해결하기 위해 Vector 클러스터 확장 및 고도화.
- 높은 카디널리티와 복잡한 PromQL로 인한 성능 저하를 Recording Rules를 통해 해결, 쿼리 성능 개선.
- SLI 요약 및 CUJ별 상세 대시보드를 통해 서비스 상태를 한눈에 파악하고, Slack 연동 알람을 통해 즉각적인 대응 가능.
Next Feeds

리눅스의 Control Groups 기능이 Kubernetes에 어떻게 적용되는지 살펴보기
리눅스 cgroups를 활용한 Kubernetes 자원 관리 방법과 실제 설정 연동 방식, 운영 팁을 소개합니다.
cgroupsKubernetes자원 격리CPU 제한메모리 제한
2025. 2. 27.
Naver d2
카카오의 언어모델, Kanana 테크니컬 리포트 공개
카카오가 자체 개발한 Kanana 언어모델 패밀리의 기술 보고서를 공개하고, Kanana Nano 2.1B 모델을 오픈소스로 공개했습니다.
KananaLLMAI 모델오픈소스언어모델
2025. 2. 27.
카카오
업무 효율화를 성공시킨 "임베디드 보드 성능 예측 AI 모델" 개발기
임베디드 보드 성능 예측 AI 모델 개발을 통해 HW 임베딩 없이 SW 알고리즘 성능 예측, 업무 효율성 향상
임베디드 보드AI 모델성능 예측TVM 컴파일러GraphSAGE
2025. 2. 26.
현대자동차
실무에서 적용하는 테스트 코드 작성 방법과 노하우 Part 3: Given 지옥에서 벗어나기 - 스노우볼을 굴려라
Given 절 작성의 어려움을 해결하고 테스트 코드 재사용성을 높여 효율적인 테스트 환경을 구축하는 방법을 제시합니다.
테스트 코드Given 절java-test-fixturesDomainFixtureMocking
2025. 2. 26.
카카오페이
Let'Swift 2024 X 올리브영: 기술과 경험을 나누는 특별한 만남
올리브영 iOS 개발팀이 Let'Swift 2024에서 부스를 운영하며 개발자들과 소통하고, 앱 설치 증가 및 긍정적 인지도 향상 성과를 거둠.
Let'Swift올리브영iOS 개발앱 개발기술 컨퍼런스
2025. 2. 26.
올리브영

LLM을 활용한 스마트폰 시세 조회 서비스 구축
LLM을 활용하여 스마트폰 중고 시세를 조회하고 유사 게시글을 추천하는 서비스 구축 과정을 소개합니다.
LLM스마트폰 시세중고거래BigQuery벡터 DB
2025. 2. 26.
당근