컬
컬리
January 7, 20231회
데이터사이언스팀이 예측모델을 개발하고 운영하는 방법을 소개합니다.

간단 소개
컬리 데이터사이언스팀의 모델 개발 및 운영 방법, 경험 공유: 수요예측, MLOPS, 팀 문화, 사후 대응, 예측 성능 분석, 모델링 주의사항.
AI Summary
- 데이터사이언스팀 소개 및 핵심 업무
- 컬리 데이터사이언스팀은 수요예측/최적화 모델과 추천/랭킹 모델 개발 및 운영을 통해 비즈니스에 기여한다.
- MLOPS 도입으로 안정적인 서빙 환경을 구축하고 있다.
- 팀 문화는 개인의 역량과 커리어 방향성을 고려한 프로젝트 담당, 넓은 영역에 대한 책임과 권한 부여, 활발한 팀원 간 공유를 지향한다.
- 수요예측 모델 개발/운영 경험 공유
- 모델 배포 후 사후 대응의 중요성을 강조하며, 데이터 수집/처리 과정에서의 문제 해결 및 비즈니스 변화에 대한 민감한 대응이 필요하다.
- 예측 성능 분석 시 다각적인 접근과 세심한 판단이 중요하며, 비즈니스 환경의 불확실성을 고려해야 한다.
- 전통적인 시계열 모델보다는 다수의 Regression 모델을 앙상블 방식으로 활용하며, Overfitting과 Leakage를 주의해야 한다.
- 문제 정의 및 프로젝트 관리는 여전히 중요하며, 요청사항 분석 및 기대치 합의를 통해 프로젝트 성공 가능성을 높일 수 있다.
Next Feeds

AWS re:Invent 2022 방문기
AWS re:Invent 2022 참관 경험 공유: 새로운 기술 트렌드 학습, 다양한 AWS 서비스 체험, 그리고 글로벌 엔지니어들과의 네트워킹.
AWS re:Invent클라우드AWS BatchDevOpsExpo
2023. 1. 6.
올리브영
티맵, 3시간 뒤 출발하면 얼마나 걸려? - 17편-미래예측을 위한 경로탐색엔진 (CATCHUp Algorithm)
티맵의 미래 예측 경로 탐색 엔진인 CATCHUp 알고리즘의 개발 과정과 최적화 기법, 그리고 성능 향상 결과를 설명합니다.
티맵경로탐색CATCHUpTime-DependentThor 엔진
2023. 1. 6.
티맵모빌리티
Version Catalog 도입을 위한 온보딩 - gradle 버전 관리를 위한 Version Catalog 도입
Gradle 버전 관리를 위한 Version Catalog 도입 배경, 장점, 적용 방법 및 build-logic 모듈 활용을 설명합니다.
Version Cataloggradle버전 관리build.gradlebuild-logic
2023. 1. 6.
카카오헤어샵

AI 워크로드에 적합한 스토리지
AI 워크로드의 종류별 스토리지 요구사항, 학습 단계별 스토리지 역할, 그리고 스토리지 타입별 장단점을 분석하여 AI 워크로드에 적합한 스토리지 특성을 제시합니다.
AI 워크로드스토리지머신러닝딥러닝데이터
2023. 1. 6.
글루시스

입사 첫날에 36시간 점검 경험하기
신입 개발자가 쿠키런: 킹덤 런칭 직후 36시간 점검을 겪으며 데이터 복구 과정을 경험하고, 협업의 중요성을 깨닫는 과정을 담은 회고.
쿠키런 킹덤데브시스터즈데이터베이스장애 대응데이터 복구
2023. 1. 6.
데브시스터즈

Spark on Kubernetes로 가자!
뱅크샐러드의 데이터 분석 환경을 EMR에서 Kubernetes로 전환한 경험 공유 및 문제 해결 과정, 향후 과제 제시.
SparkKubernetesEMR데이터 분석Glue
2023. 1. 5.
뱅크샐러드