당
당근
June 26, 20251회
당근에서 정보 유실 없이 업체 정보를 모으는 방법

간단 소개
당근의 로컬 프로필 중복 문제 해결과 정보 통합을 위한 Composite Snapshot 개발 과정을 소개하고, 향후 발전 방향을 제시합니다.
AI Summary
- 로컬 프로필의 중요성 및 생성 방식
- 당근 내 업체 정보의 기본 단위인 로컬 프로필은 다양한 지역 기반 서비스의 기반이 됨
- 로컬 프로필은 사장님 직접 등록, 유저 제안, 외부 수급의 세 가지 방식으로 생성됨
- 중복 생성을 방지하기 위한 장치가 필요하며, 중복된 프로필을 탐지하고 병합하는 기능이 중요함
- 중복 해결 및 정보 통합을 위한 Composite Snapshot 개발
- 로컬 프로필 중복 시 대표 프로필을 선정하여 병합하고, 병합된 프로필의 최신 정보 유실 방지 필요
- Composite Snapshot은 로컬 프로필 변경 이력을 기반으로 최적의 데이터를 대표 프로필에 반영하는 방식임
- 변경 이력에는 변경 시점, 소스, 값 등을 포함하며, Filter와 Evaluator를 통해 데이터 선정 정책을 유연하게 구현함
- 결론 및 기대 효과
- Composite Snapshot을 통해 가격표, 영업시간 등 다양한 정보를 대표 프로필에 노출 가능하게 됨
- 정보 유실 방지를 위한 기반 체계를 마련하고, 시스템 발전 방향을 구체화하는 데 기여함
- 앞으로도 데이터 선정 정책 및 구조를 지속적으로 발전시켜 나갈 예정임
Next Feeds

AWS Glue ETL을 활용한 CRM 데이터의 효율적인 병렬처리 전략
AWS Glue ETL을 활용하여 CRM 데이터 처리 효율성을 높이고, 서버리스 아키텍처로 운영 부담을 줄이며 비용을 절감한 사례 분석.
AWS GlueETLStep FunctionsEventBridge서버리스
2025. 6. 26.
AWS

밑바닥부터 시작하는 실시간 데이터 파이프라인 : Debezium 톺아보기
Debezium을 활용한 실시간 데이터 파이프라인 구축 과정과 Kafka Connect 연동 방식, 성능 개선 및 커스텀 SMT 개발 경험을 공유합니다.
DebeziumCDCKafka Connect데이터 파이프라인실시간 데이터
2025. 6. 26.
여기어때

카카오, AI와 함께하는 사내 해커톤 '10K' 진행합니다.
카카오가 AI 기반 개발 방식 '바이브 코딩'을 도입한 사내 해커톤 '10K'를 개최하여 AI 네이티브 기업으로의 전환을 가속화한다.
카카오해커톤AI바이브 코딩MVP
2025. 6. 26.
카카오

늘어가는 조회트래픽 Elasticsearch로 분산시키기
늘어나는 조회 트래픽을 Elasticsearch로 분산시킨 경험 공유: 도입 배경, 과정, 결과, 운영 팁, Opensearch 전환 및 성능 비교.
ElasticsearchOpensearch트래픽 분산CQRSfeature toggle
2025. 6. 25.
Naver d2

AWS Summit Seoul 2025 발표 후기 - 소중한 우리의 시간을 위한 클라우드 스케일링 자동화
올리브영의 클라우드 스케일링 자동화 여정과 효과적인 스케일링 전략, SRE 핵심 원칙, 비즈니스 중심 모니터링을 소개합니다.
AWSAuto ScalingSRE클라우드 자동화비즈니스 중심 모니터링
2025. 6. 25.
올리브영

Claude Code의 Plan Mode - 코딩하기 전에 계획하라
Claude Code의 Plan Mode는 코딩 전 계획 수립을 돕는 기능으로, 효율적인 개발과 고품질 결과물을 위한 프롬프트 엔지니어링 전략을 제시한다.
Plan ModeClaude Code프롬프트 엔지니어링메타 프롬프팅에이전트 중심 개발
2025. 6. 25.
인포그랩