토
토스
September 19, 20251회
토스증권의 수 천개 실시간 데이터 파이프라인 운영방법 #2: MSA 환경 Observability 높이기
간단 소개
토스증권은 MSA 환경에서 Kafka Client와 Broker 연결 관계를 파악하기 위해 METADATA API request log와 ClickHouse를 활용하여 Observability를 높였습니다.
AI Summary
- MSA 환경 Observability의 중요성
- 토스증권은 10,000개의 서비스 Pod가 1,000개의 Topic을 사용하는 MSA 환경에서 Kafka Client와 Broker 간 연결 관계 파악의 중요성을 강조합니다.
- 서비스 서버와 Kafka Broker 간 연결 관계는 시스템 가시성을 높이고 데이터 파이프라인 관점에서 Lineage에 포함시키는 것이 중요합니다.
- 요구 조건 및 해결 방법
- 원천 서비스 소스코드 수정 없이, 실시간으로 연결 현황을 반영하며, 100% 커버리지를 보장하는 연결 관계 파악이 필요했습니다.
- Kafka Broker의 METADATA API request log를 100% 활용하고, 부족한 정보는 Consumer Group Lag metric과 join하여 해결했습니다.
- ClickHouse를 활용한 시스템 구축
- ClickHouse를 통해 대량의 request log를 효율적으로 처리하고, METADATA request log, Lag Metric, conntrack 정보를 join하여 서비스 연결 정보를 확보했습니다.
- Materialized View를 활용하여 실시간으로 데이터가 갱신되는 테이블을 생성하고, Lineage 시각화 및 Grafana 연동을 통해 시스템 가시성을 향상시켰습니다.
Next Feeds

P-Canvas, 팀을 이해하기 위한 엔지니어링 기법
P-Canvas는 팀원 이해를 돕는 매니징 엔지니어링 기법으로, 개인의 성장과 변화를 시각화하여 효과적인 소통과 성장을 지원합니다.
P-Canvas매니징 엔지니어링1on1 미팅팀 관리성장
2025. 9. 19.
LY Corp
생산성 혁신의 실험: AI 마일리지 프로그램
카카오 AI 마일리지 프로그램은 개발 생산성 향상과 역할 재정의를 통해 AI 네이티브 전환을 가속화하고 있습니다.
AI 마일리지 프로그램AI 네이티브생산성 향상개발자 역할 재정의AI 협업
2025. 9. 19.
카카오
실패를 장려하는 실험적 문화
카카오는 AI 기술 변화에 발맞춰 실패를 장려하는 실험적 문화를 조성하고, AI Beer Chat Day를 통해 AI 생태계를 확장하며, AI를 활용한 협업을 장려합니다.
AI 네이티브실험적 문화AI Beer Chat Day지능형 협업Fail Fast, Learn Faster
2025. 9. 19.
카카오
[목차] AI Native: 실행과 확산 사례집
카카오는 AI를 개발 전반에 통합하여 생산성을 높이고, AI 네이티브 문화를 확산시키며, 데브옵스 및 콘텐츠 관리 혁신을 추구합니다.
AI 네이티브SDLC데브옵스콘텐츠 모더레이션AI 협업
2025. 9. 19.
카카오
[칼럼] 오픈소스기술의 AI 네이티브 전환 성공 사례
카카오의 오픈소스 기술 AI 네이티브 전환 성공 사례로, 검증 자동화와 LLM 기반 라이선스 분석을 통해 효율성을 높였다.
오픈소스AI 네이티브자동화LLM라이선스
2025. 9. 19.
카카오
AI 윤리 원칙과 AI 리스크 관리 프레임워크
카카오는 AI 윤리 원칙을 수립하고 리스크 관리 프레임워크를 구축하여 AI의 윤리적이고 안전한 사용을 보장하고자 합니다.
AI 윤리AI 리스크 관리AI 편향성AI 가드레일카카오 ASI
2025. 9. 19.
카카오