N
Naver d2
November 18, 20252회
6개월 만에 연간 수십조를 처리하는 DB CDC 복제 도구 무중단/무장애 교체하기

간단 소개
네이버페이 DB CDC 복제 도구 mig-data를 ergate로 무중단/무장애 전환한 과정과 기술적 도전, 해결 경험을 공유합니다.
AI Summary
ergate 프로젝트 개요 및 목표
- 네이버페이 Plasma 프로젝트의 최종장으로, 기존 mig-data 복제 도구를 ergate로 전환했습니다.
- 목표는 사용량 증가에 따른 확장 가능한 구조와 백엔드 개발자의 유지 보수 용이성 확보였습니다.
- 기존 양방향 복제 관련 제약사항을 제거하고 단방향 복제에 최적화했으며, 주로 Spring Framework 기반 개발 경험을 가진 인력에 맞춰 재개발했습니다.
기술 스택 및 주요 기능
- Apache Flink (Java 17)와 Spring Framework (Kotlin 1.9)를 핵심 기술 스택으로 채택했습니다.
- Flink는 저지연, 대용량, 고가용성 처리에 강점과 Kafka 연동 용이성 때문에 선택되었습니다.
- 주요 기능은 복제, 검증, 복구로 구성되며, 복제 실패 시 검증 단계에서 검출 후 복구합니다.
- DDL 실행 순서 의존성 제거, 일시 복제 중단 해소, 다양한 복구 편의 기능 제공 등 기능이 개선되었습니다.
- Flink JdbcSink 확장 및 비동기 검증으로 성능을 개선하고 1초 내 복제 보장 목표를 달성했습니다.
아키텍처 검증 및 전환 과정
- QPS 10배 이상 처리 목표로 성능을 검증했으며, 객체 직렬화, 데이터 스큐, DB I/O, 네트워크 버퍼, 검증 성능 등을 개선했습니다.
- Flink job manager/task manager 장애, Spring 모듈 장애, Source/Target DB 장애 등 내결함성을 검증했습니다.
- Target DB 장애 시 서킷 브레이커를 도입하여 Flink 장애를 방지했습니다.
- 중복 복제 전략으로 mig-data와 ergate를 동시 운영 후 순차 전환하여 무중단/무장애 전환에 성공했습니다.
- job manager Metaspace OOM 및 split brain 등 Flink 관련 트러블슈팅 경험을 공유했습니다.
Next Feeds

Slack Command를 통한 Jira–GitLab 연동 기능 개발기
롯데ON이 Jira-GitLab 연동 배포 과정의 반복 업무를 Slack Command 기반 자동화로 해결하여 효율성과 안정성을 높인 개발기.
Slack CommandJiraGitLab배포 자동화DevOps
2025. 11. 18.
롯데ON

Amazon Bedrock과 함께 Claude Code 사용하기
Amazon Bedrock을 통해 Anthropic Claude Code를 활용하여 비용 효율성, 보안, 규정 준수, 거버넌스를 강화하는 방법을 설명합니다.
Amazon BedrockClaude Code생성형 AI데이터 프라이버시거버넌스
2025. 11. 18.
AWS

처음 만나는 OpenTelemetry (feat. Collector)
네이버 사내 행사에서 발표된 OpenTelemetry와 Collector에 대한 소개 및 모니터링 플랫폼 전환 경험 공유.
OpenTelemetryCollector모니터링 플랫폼ObservabilityNAVER ENGINEERING DAY
2025. 11. 17.
Naver d2

AWS advanced JDBC wrapper 플러그인 이해하기
AWS Advanced JDBC Wrapper의 Aurora 초기 연결 전략 및 Failover v2 플러그인이 Aurora 환경의 연결 및 장애 조치 관리를 어떻게 개선하는지 설명합니다.
AWS Advanced JDBC WrapperAuroraJDBC 드라이버초기 연결 전략Failover v2
2025. 11. 17.
AWS

Day1Company의 Amazon EKS와 Amazon Bedrock 기반 초개인화 학습 피드백 서비스 사례
데이원컴퍼니가 Amazon EKS와 Bedrock을 활용해 초개인화 학습 피드백 시스템을 구축, 비용 절감 및 사용자 만족도 향상.
Amazon EKSAmazon Bedrock초개인화 학습생성형 AISTT
2025. 11. 17.
AWS
if(kakao)25 정규돈 CTO 키노트 후기
카카오 정규돈 CTO가 if(kakao)25 키노트에서 발표한 AI 네이티브 전환 로드맵과 AI를 통한 개발 및 기업 전체 생산성 혁신, 그리고 AI 시대에 필요한 새로운 개발자상에 대한 내용.
AI Native카카오정규돈 CTO개발 생산성SDLC
2025. 11. 17.
카카오