펫
펫프렌즈
November 7, 20252회
Kafka에서 S3로 실시간 데이터 수집 파이프라인 설계와 구축기

간단 소개
펫프렌즈가 MariaDB Trigger 한계를 극복하고 실시간 이벤트 데이터 수집을 위해 Kafka-S3 파이프라인을 직접 구축한 과정과 설계, 운영 노하우를 공유합니다.
AI Summary
실시간 데이터 수집 도입 배경 및 아키텍처 선택
- 기존 MariaDB Trigger 기반 로그 테이블의 스키마 변경 및 확장성 한계로 CDC 기반 Kafka 전환.
- 광고/사용자 행동 이벤트의 장기 보관 및 분석을 위해 S3 + Athena 레이크하우스 선택.
- S3 Sink Connector의 Parquet 포맷 제약 및 세부 로직 반영 어려움으로 Kafka Consumer 직접 개발 결정. Kafka Consumer 핵심 설계 및 안정성 확보
- 메시지 누락 방지를 위한 At-least-once 전략 및 수동 오프셋 커밋 구현.
- Flush 조건 (시간/버퍼 크기) 및 종료/리밸런스 시 버퍼 Flush 처리로 데이터 유실 방지.
- 실패 처리: 레코드 단위 오류는 skipped_offsets 기록, 배치 단위 오류는 재시도 후 프로세스 종료.
- 모니터링: 상세 로그, 오프셋 메타데이터 (Airflow DAG), 인프라 리소스 모니터링으로 안정적 운영. 운영 성과 및 향후 계획
- DB 운영 부담 감소, 로그 데이터 레이크 통합, 새로운 이벤트 수집 채널 확보.
- 향후 CDC 로그 수집 확장 및 Apache Iceberg 도입으로 S3 기반 트랜잭션 및 스키마 진화 기능 강화 검토.
Next Feeds

토스에서 가장 안 좋은 경험 만들기
토스에서 광고를 통해 비즈니스 목표와 사용자 경험의 교집합을 찾아내어 큰 성과를 달성한 과정을 설명합니다.
토스광고사용자 경험비즈니스교집합
2025. 11. 7.
토스

코드 품질 개선 기법 22편: To equal, or not to equal
Java/Kotlin에서 equals 오버라이딩 시 발생할 수 있는 문제점과 올바른 동일성/등가성 정의 방법을 설명합니다.
equalshashCode동일성등가성코드 품질
2025. 11. 7.
LY Corp

여기어때 검색 광고: 랭킹 부스팅 구축기
여기어때가 검색 광고 랭킹 부스팅 기능을 구축하며 노출 수 보장에서 순위 상승 보장 방식으로 전환하고, Elasticsearch를 활용한 아키텍처와 A/B 테스트를 통해 성공적으로 도입한 과정을 설명합니다.
검색 광고랭킹 부스팅ElasticsearchA/B 테스트Delta Score
2025. 11. 7.
여기어때
카카오 그룹사 기술 공유의 장, Krew Day
카카오 그룹사 기술 공유 행사 'Krew Day'는 Sync & Play 컨셉으로 AI, 코딩 도구 등 다양한 기술 주제를 다루며 그룹사 간 기술 시너지를 창출했습니다.
Krew Day카카오 그룹사기술 공유AI개발자
2025. 11. 7.
카카오

소소한 언플러그드 도서관 '테미도' 이야기
SK플래닛이 개발자들을 위해 '언플러그드' 테크 미니 도서관 '테미도'를 운영하며 AI 중심의 최신 기술 도서를 공유하고 성장을 지원하는 이야기.
테미도언플러그드 도서관AI 도서개발자 성장사내 공유
2025. 11. 7.
skplanet

SLM 기반 Agentic AI: Planner–Caller–Generator 구조 설계와 성능 분석
한컴이 제안한 SLM 기반 Agentic AI 'P-C-G' 구조는 LLM의 한계를 극복하고 한국어 환경에서 효율적인 성능을 제공한다.
SLMAgentic AIP–C–G한국어 환경효율성
2025. 11. 7.
한글과컴퓨터