유튜브블로그Top 10
내 프로필

데브허브 안내
소개업데이트 소식

데브허브 커뮤니티

[10분 테코톡] 몽이의 Metric

우아한테크

2025. 9. 19.

0

#backend
#infra
  • 모니터링은 실행 중인 서버를 볼 수 없기 때문에 필요하며, 시스템 상태 및 성능을 지속적으로 관찰하고 추적하여 문제 원인 파악, 예방, 성능 분석을 가능하게 함 🧐
  • 관찰 가능성을 위해 로그(원인 파악), 트레이스, 메트릭(문제 예방)이 필요하며, 메트릭은 연속적이고 집계 가능한 수치 데이터로 시스템의 특정 측면을 시간 기준으로 측정한 값임 📊
  • 메트릭을 통해 CPU 사용량 같은 시스템 데이터뿐 아니라 사용자 체감 측정값, SLI/SLO 같은 비즈니스 약속 정보를 얻을 수 있음 🤝
  • Gauge(순간 상태 측정), Counter(계속 증가하는 값), Histogram(분포도) 등의 메트릭 타입을 활용하여 다양한 정보를 수집하고 분석함 📈
  • 4가지 황금 신호(Errors, Latency, Traffic, Saturation)를 기준으로 메트릭을 설정하며, 특히 Latency(지연 시간)와 Traffic(요청 수)을 중점적으로 다룸 🚦
  • Latency 측정 시 평균값의 함정을 피하기 위해 Percentile 값을 사용, 롱테일 문제를 해결하고 사용자 경험 기준을 설정함 ⏱️
  • Traffic 변화를 모니터링하여 CPU, 메모리 사용량 변화를 파악하고, 오토 스케일링 또는 캐싱 등의 전략을 수립함 🚀
  • 개별 API 트래픽을 관리하여 병목 지점을 찾고, 결제 승인/결제 결과와 같이 연결된 API의 트래픽 비교를 통해 문제점을 발견함 🔍
  • 모니터링은 단순히 CPU cap 알람을 넘어 비즈니스 관심사를 관찰하고 추적하는 것을 목적으로 하며, 대시보드를 통해 시각화하고 교차 검증하여 서비스에 맞는 병목 지점을 찾아 개선하는 데 활용됨 💡

Recommanded Videos