카
카카오
January 17, 20251회
Ingress Nginx Controller의 Prometheus Metric 병목 현상: 원인 분석과 해결 (1부)
간단 소개
카카오 Ingress Nginx Controller의 Prometheus metric 유실 문제 원인 분석 및 해결 과정 (1부): 트래픽 증가에 따른 Socket 과다 생성 및 Goroutine 누적 현상 분석.
AI Summary
- Ingress Nginx Controller Metric 유실 문제
- 카카오 광고 API 서버의 Ingress Nginx Controller에서 Prometheus metric 유실 발생
- Nginx request volume이 No Data로 표시되거나, 정상치보다 매우 낮게 기록되는 현상 발생
- 서버는 정상적으로 요청을 처리하고 있었으며, 트래픽이 일정 기준치를 상회할 때 재현됨
- 원인 분석 및 병목 지점 확인
- Ingress Nginx Controller Pod의 Memory 사용량이 비정상적으로 증가하는 것을 확인
- Pod는 Nginx와 Ingress Nginx Controller 두 개의 Process로 구성
- Nginx는 Lua script를 통해 Controller에 Metric을 전송하고, Controller는 Go로 작성됨
- /tmp/prometheus-nginx.socket에 Socket이 과도하게 쌓이는 현상 발견
- Controller의
handleMessages()함수가 트래픽 증가에 따라 느려져 Goroutine이 누적되는 것이 원인으로 추정
- 결론 및 향후 계획
- Metric 처리 과정에서 Critical Section 보호를 위한 Mutex 관련 로직이 병목의 원인일 가능성 제시
- 2부에서는 Go 프로파일링을 통해
handleMessages()함수의 성능 저하 원인을 분석할 예정
Next Feeds
분산 시스템에서 로컬 캐시 활용하기
분산 시스템에서 로컬 캐시를 효과적으로 활용하기 위한 설계, 구현 경험 및 데이터 정합성 유지 전략을 소개합니다.
로컬 캐시분산 시스템Redis캐싱 전략데이터 정합성
2025. 1. 16.
카카오페이

사용자에서 데이터 엔지니어로, 쏘카 온보딩 회고
쏘카 데이터 엔지니어링팀 온보딩 회고: 데이터 엔지니어의 성장 과정과 주요 프로젝트 경험, 그리고 앞으로의 목표를 담았습니다.
데이터 엔지니어링쏘카온보딩데이터 파이프라인Kubernetes
2025. 1. 16.
쏘카

AI와 엔터테인먼트가 만났다! 제3회 카카오엔터 해커톤, ENTERTHON 2024 현장 이야기
카카오엔터테인먼트의 사내 해커톤 ENTERTHON 2024는 AI와 엔터테인먼트의 융합을 통해 혁신적인 아이디어를 발굴하고, 실제 서비스로 연결될 가능성을 제시했다.
ENTERTHON해커톤카카오엔터테인먼트AI엔터테인먼트
2025. 1. 16.
카카오엔터테인먼트FE

당신2 9하던 디자인 시스템? 0.5인 리소스로 효율적으로 구축하기
0.5인 리소스로 디자인 시스템을 효율적으로 구축하고 운영하는 전략과 경험을 공유하며, 서비스 특성에 맞는 시스템 도입 및 지속적인 개선 방안을 제시합니다.
디자인 시스템ANTDTailwindCSSMVP피드백 프로세스
2025. 1. 15.
29cm
AI 카모톤 - 9시까지 프로토타입 만드실 수 있죠?
카카오모빌리티의 AI 해커톤 'AI 카모톤' 행사 내용, 준비 과정, 결과, 그리고 1등 팀 인터뷰를 통해 AI 기술 활용 사례를 소개합니다.
AI해커톤카카오모빌리티프로토타입RAG
2025. 1. 15.
카카오모빌리티

n8n과 OpenAI로 이메일 분류 자동화하기
n8n과 OpenAI를 활용한 이메일 분류 자동화 시스템 구축 사례 및 고려사항을 제시합니다.
n8nOpenAI이메일 분류자동화Notion
2025. 1. 15.
인포그랩