A
AWS
June 17, 20251회
알리는사람들의 Amazon Data Firehose로 Amazon DynamoDB를 Amazon S3 tables로 실시간 복제하기

간단 소개
알리는사람들은 Amazon Data Firehose를 활용해 DynamoDB 데이터를 S3 Tables로 실시간 복제하고 Athena로 분석하는 파이프라인을 구축했습니다.
AI Summary
- 알리는사람들의 데이터 파이프라인 구축
- 알리는사람들은 Amazon Data Firehose를 사용하여 Amazon DynamoDB의 실시간 스트림 데이터를 Apache Iceberg 기반의 Amazon S3 Tables로 적재하고, Amazon Athena에서 분석 가능한 형태로 전환하는 파이프라인을 구축했습니다.
- 센드온(Sendon) 메시징 플랫폼은 DynamoDB를 주요 저장소로 사용하지만, 분석을 위해 DynamoDB 데이터를 S3 Tables로 복제합니다.
- 파이프라인 아키텍처 및 구성
- DynamoDB의 변경 이벤트는 Kinesis Data Stream을 거쳐 Data Firehose로 전달되고, Lambda 함수를 통해 데이터가 정제되어 Iceberg 테이블에 적재됩니다.
- Resource Link를 사용하여 Firehose가 s3tablescatalog에 접근하며, 데이터는 Parquet 포맷으로 자동 변환됩니다.
- Lake Formation을 통해 접근 권한을 관리하고, Athena/QuickSight를 통해 데이터를 분석/시각화합니다.
- 파이프라인 확장 계획
- 향후 멀티 테이블 대응, 지표 분석 자동화, 대시보드 연동 등을 통해 데이터 레이크를 확장할 계획입니다.
- 실시간 운영 데이터를 Iceberg 기반으로 통합 분석하여 데이터 기반 의사결정을 가속화하고 더 나은 메시징 서비스를 제공하는 것을 목표로 합니다.
Next Feeds

Amazon RDS for PostgreSQL, Amazon Aurora PostgreSQL, Babelfish for Aurora PostgreSQL에서의 동적 데이터 마스킹
Amazon RDS for PostgreSQL, Aurora PostgreSQL, Babelfish에서 동적 데이터 마스킹을 구현하고 한계점을 분석합니다.
데이터 마스킹PostgreSQLAmazon RDSAuroraBabelfish
2025. 6. 17.
AWS

서비스 조직에서 Kafka를 사용할 때 알아 두어야 할 것들 (4)
네이버 서비스 조직에서 Kafka 사용 시 프로듀서 최적화 및 압축 기능 활용법, Kafka 자료구조 등을 다룬 NAVER ENGINEERING DAY 발표 내용 요약.
Kafka프로듀서최적화압축NAVER ENGINEERING DAY
2025. 6. 16.
Naver d2

서비스 조직에서 Kafka를 사용할 때 알아 두어야 할 것들 (3)
Kafka 클라이언트의 클러스터 상태 파악 방법, metadata 교환 매커니즘, NAVER ENGINEERING DAY를 소개합니다.
KafkaMetadata클러스터NAVER ENGINEERING DAY기술 교류
2025. 6. 16.
Naver d2

UX 리서처와 리서치 오퍼레이터가 함께 만든 ‘리서치 자율주행 프로젝트’
UX 리서처 부족 문제를 해결하기 위해 리서치 자율주행 프로젝트를 진행, 리서처와 플랫폼팀 협업으로 GPT를 활용하여 효율적인 리서치 환경 구축.
UX 리서치리서치 자율주행리서치 플랫폼GPT협업
2025. 6. 16.
토스

무신사 QA 팀은 어떤 도구를 업무에 사용할까?
무신사 QA팀은 엑셀 기반 리포트의 한계를 극복하고, 'QA Admin' 시스템을 구축하여 업무 효율성을 높이고 데이터 기반 인사이트를 얻고자 합니다.
QA자동화리포트데이터베이스효율성
2025. 6. 15.
무신사

데이터는 흐른다, 연결될 준비가 되었다면
네이버 웹툰의 코호트 시스템 소개: 유저 세그먼트 정의, 액션 채널 연동 자동화, 데이터 흐름 효율성 증대.
코호트 시스템데이터 자동화유저 세그먼트ML 모델마케팅 캠페인
2025. 6. 13.
Naver d2