여
여기어때
December 16, 20251회
“서버가 죽었어요”에서 시작된 이야기, Grafana OnCall과 Amazon Connect로 완성한 실전형 온콜 시스템

간단 소개
여기어때 SRE팀이 Grafana OnCall과 Amazon Connect를 활용해 AWS Target Group 장애를 실시간 감지하고, 비용 효율적인 자동 전화 알림 및 대응 시스템을 구축한 사례.
AI Summary
온콜 시스템 구축 동기
- SRE 엔지니어의 야간 장애 대응 부담 경감 및 비용 효율적 알림 시스템 필요성 대두.
- 고가 상용 솔루션 대신 Grafana OnCall, Amazon Connect, Slack 조합으로 자동 전화 알림 시스템 구축.
- Grafana OnCall 기반 통합
- LGTM Stack에 Grafana OnCall을 통합, 관측-대응 전 과정 관리 및 온콜 일정, 라우팅, Slack 동기화 제공.
- AWS RDS(MySQL) 연동으로 데이터 영속성 확보, Helm Chart로 EKS 배포.
- Amazon Connect로 사용량 기반 전화 알림 비용 최적화 및 음성 안내 자동화.
- 실시간 감지 및 자동 알림
- AWS ELBv2 API 호출로 Target Group Unhealthy 상태 실시간 감지.
- OnCall DB에서 iCal 데이터 파싱, 담당자 전화번호 조회 후 Amazon Connect로 즉시 발신.
- 알림 피로도 감소를 위해 DB 상태 관리 및 Slack '전화 중지' 버튼으로 통화 제어.
- 야간/주말 알림, Team 태그 기반 라우팅 등 운영 팁 적용.
Next Feeds

Compose NestedScrollConnection 을 이용한 딜허브 화면 구현
Compose NestedScrollConnection을 활용하여 딜허브 화면의 독특한 Collapsing Tab 및 스크롤 인터랙션 구현 방법을 상세히 설명합니다.
ComposeNestedScrollConnection딜허브Collapsing Tab스크롤 인터랙션
2025. 12. 16.
여기어때

️여기어때 Date·인원 선택 UI 만들기-SwiftUI Calendar Core & DateTravelerSelector 구조 재설계
여기어때는 SwiftUI 기반 날짜·인원 선택 UI를 Calendar Core와 Traveler Selector로 분리하여 도메인별 정책 차이에 유연하게 대응하고 성능을 최적화했습니다.
SwiftUICalendar CoreDateTravelerSelectorUI 재설계성능 최적화
2025. 12. 16.
여기어때

OpenTelemetry와 Kafka를 활용한 안정적인 Observability 구축기
'여기어때'가 OpenTelemetry와 Kafka를 활용하여 MSA 환경에서 안정적이고 확장 가능한 Observability 아키텍처를 구축한 경험을 공유합니다.
OpenTelemetryKafkaObservabilityMSACollector
2025. 12. 16.
여기어때

Claude Code를 활용한 예측 가능한 바이브 코딩 전략
Claude Code를 활용한 바이브 코딩 전략으로, LLM의 인지적 한계를 시스템적 도구와 효과적인 프롬프트 작성으로 극복하는 방법을 제시한다.
바이브 코딩Claude CodeLLM 한계컨텍스트 관리프롬프트 작성
2025. 12. 16.
컬리
MongoDB 8.0 업그레이드 해야하는 12가지 이유
MongoDB 8.0은 장기 지원, 쓰기/쿼리 성능, 샤딩 유연성, 검색 기능 통합 등 전반적인 안정성과 운영 효율을 크게 개선했습니다.
MongoDB8.0업그레이드성능샤딩
2025. 12. 16.
카카오

Running Elasticsearch on Kubernetes the Easy Way, Part 2 — Data Node Warm-Up
Karrot은 Elasticsearch의 Kubernetes 롤링 재시작 중 발생하는 지연 시간 문제를 search-coordinator 프록시 기반 웜업 시스템으로 해결하여 안정적인 배포를 가능하게 했다.
ElasticsearchKubernetesWarm-upsearch-coordinatorRolling Restart
2025. 12. 16.
당근