당
당근
July 17, 20255회
당근 데이터 디스커버리 구축기: DataHub와 DataWiki로 여는 데이터 탐색의 첫걸음

간단 소개
당근은 DataHub와 DataWiki를 구축하여 데이터 디스커버리 환경을 개선하고, 챗봇 인터페이스를 통해 데이터 접근성을 높이려 한다.
AI Summary
- DataHub 도입 및 구축
- 당근 데이터 가치화 팀은 데이터 디스커버리를 위해 DataHub를 도입, 메타데이터 수집, 저장, 관리, 탐색 기능을 구축함.
- Airflow를 활용한 데이터 파이프라인 자동화, n8n을 이용한 데이터 신선도 모니터링 시스템 구축, 전사 구성원에게 Editor 권한을 부여하여 데이터 관리의 지속성을 확보함.
- DataWiki 구축 및 활용
- DataHub의 한계를 보완하기 위해 DataWiki를 구축, 도메인 중심의 탐색 구조를 구성하고 지표, 테이블, 도메인 비즈니스 로직 섹션으로 나누어 데이터를 수집함.
- BigQuery를 메타데이터의 SSOT(Single Source of Truth)로 지정, DataWiki의 비정형 정보를 정형화하여 DataHub와 연계, Text-to-SQL LLM 챗봇 구축의 발판을 마련함.
- 향후 과제 및 계획
- DataHub와 DataWiki의 분리된 진입점, Notion 기반 DataWiki 관리의 어려움, DataHub 커스터마이징의 한계를 극복하기 위해 당근만의 데이터 카탈로그 플랫폼 구축을 계획함.
- Text-to-SQL 챗봇을 고도화하여 사용자 경험을 개선하고, 데이터와 더 친숙하게 소통할 수 있는 환경을 조성할 계획임.
Next Feeds

일본 소도시 여행의 감성을 디자인하다: 마케팅 굿즈 제작 그리고 개선
여기어때는 일본 소도시 여행 마케팅을 위해 굿즈를 제작하고 개선하며, 콜라보 콘텐츠와 쿠폰을 통해 여행 경험을 확장합니다.
일본 소도시마케팅 굿즈유튜버 콜라보여행 경험여기어때
2025. 7. 17.
여기어때

Amazon Bedrock을 활용한 Omelet의 경로 최적화 AI 에이전트, TOAST
Amazon Bedrock 기반 Omelet의 TOAST는 자연어 기반 경로 최적화 AI 에이전트로, 복잡한 최적화 기술을 쉽게 활용하도록 지원한다.
Amazon BedrockAI 에이전트경로 최적화자연어 처리Omelet
2025. 7. 16.
AWS

‘러닝 쉐어’의 새로운 실험, 토스가 두뇌 서바이벌을 만든 이유
토스의 '러닝 쉐어' 실험과 두뇌 서바이벌 콘텐츠 제작 배경, 그리고 웹 페이지 오류 발생에 대한 내용.
토스러닝 쉐어두뇌 서바이벌실험오류
2025. 7. 16.
토스

LY의 테크 컨퍼런스, 'Tech-Verse 2025' 후기
LY Corporation의 Tech-Verse 2025 컨퍼런스 후기: AI 전략, 플랫폼 통합, 글로벌 협업 등 다양한 기술 공유.
Tech-Verse 2025AI플랫폼 통합클라우드 플랫폼AI 에이전트
2025. 7. 16.
LY Corp

Vector + VRL로 완성하는 클라우드 네이티브 Observability 실전 가이드
Vector는 클라우드 네이티브 환경에 최적화된 Observability 데이터 파이프라인 도구로, VRL을 통해 데이터 변환 및 라우팅을 효율적으로 관리한다.
VectorVRLObservabilityKubernetes데이터 파이프라인
2025. 7. 16.
인포그랩

접근성을 지원한다는 착각
접근성 지원은 단순히 추가적인 작업이 아닌, 더 나은 제품을 만들기 위한 핵심 요소이며, 텍스트 기반 인터페이스의 활용이 중요함을 강조합니다.
접근성텍스트테스트코드UI인터페이스
2025. 7. 16.
뱅크샐러드