A
AWS
June 26, 20251회
AWS Glue ETL을 활용한 CRM 데이터의 효율적인 병렬처리 전략

간단 소개
AWS Glue ETL을 활용하여 CRM 데이터 처리 효율성을 높이고, 서버리스 아키텍처로 운영 부담을 줄이며 비용을 절감한 사례 분석.
AI Summary
- 기존 방식의 문제점
- Aurora PostgreSQL, Athena 직접 쿼리 시 성능 저하 및 비용 증가
- 데이터 불일치 문제 발생
- 새로운 아키텍처
- Step Functions, Glue ETL, EventBridge 기반의 서버리스 아키텍처 도입
- Kinesis Data Streams, Firehose 통합으로 이벤트 수집 및 S3 저장
- EventBridge로 Step Functions 워크플로 트리거, Lambda 함수로 계산 대상 캠페인 선정
- Glue ETL 작업으로 데이터 가공 후 PostgreSQL 적재
- Glue ETL 최적화
- Python, PySpark 활용, Extract, Transform, Load 단계 분리
- DynamicFrame으로 반정형 데이터 처리, push_down_predicate_conditions, catalog_partition_predicates로 쿼리 최적화
- Temp View 활용, SQL 쿼리로 복잡한 연산 수행, Parquet 형식으로 중간 결과 저장
Next Feeds

밑바닥부터 시작하는 실시간 데이터 파이프라인 : Debezium 톺아보기
Debezium을 활용한 실시간 데이터 파이프라인 구축 과정과 Kafka Connect 연동 방식, 성능 개선 및 커스텀 SMT 개발 경험을 공유합니다.
DebeziumCDCKafka Connect데이터 파이프라인실시간 데이터
2025. 6. 26.
여기어때

카카오, AI와 함께하는 사내 해커톤 '10K' 진행합니다.
카카오가 AI 기반 개발 방식 '바이브 코딩'을 도입한 사내 해커톤 '10K'를 개최하여 AI 네이티브 기업으로의 전환을 가속화한다.
카카오해커톤AI바이브 코딩MVP
2025. 6. 26.
카카오

늘어가는 조회트래픽 Elasticsearch로 분산시키기
늘어나는 조회 트래픽을 Elasticsearch로 분산시킨 경험 공유: 도입 배경, 과정, 결과, 운영 팁, Opensearch 전환 및 성능 비교.
ElasticsearchOpensearch트래픽 분산CQRSfeature toggle
2025. 6. 25.
Naver d2

AWS Summit Seoul 2025 발표 후기 - 소중한 우리의 시간을 위한 클라우드 스케일링 자동화
올리브영의 클라우드 스케일링 자동화 여정과 효과적인 스케일링 전략, SRE 핵심 원칙, 비즈니스 중심 모니터링을 소개합니다.
AWSAuto ScalingSRE클라우드 자동화비즈니스 중심 모니터링
2025. 6. 25.
올리브영

Claude Code의 Plan Mode - 코딩하기 전에 계획하라
Claude Code의 Plan Mode는 코딩 전 계획 수립을 돕는 기능으로, 효율적인 개발과 고품질 결과물을 위한 프롬프트 엔지니어링 전략을 제시한다.
Plan ModeClaude Code프롬프트 엔지니어링메타 프롬프팅에이전트 중심 개발
2025. 6. 25.
인포그랩

어려운 용어가 있으신가요? ‘금.용.사.’가 알려드립니다!
카카오페이의 금융 용어 사전 서비스 '금.용.사'는 AI를 활용해 어려운 금융 용어를 쉽게 설명하고 관련 상품을 추천합니다.
금융 용어AI카카오페이캐싱프롬프트 엔지니어링
2025. 6. 24.
카카오페이