컬
컬리
April 10, 20231회
Dataflow로 컬리의 준실시간 수요 예측모델 파이프라인 구축하기 - 1편

간단 소개
컬리의 준실시간 수요 예측 모델 파이프라인 구축을 위해 Dataflow를 도입하고, Dataflow 서비스 전반에 대한 개념과 배포 과정을 소개합니다.
AI Summary
- Dataflow 도입 배경
- 컬리의 준실시간 수요 예측 모델 서빙을 위해 Dataflow를 도입, BigQuery 데이터 기반 파이프라인 구축 필요.
- 대용량 분산 처리 및 스트리밍 프로세싱 지원, auto-scaling, rebalancing 등 인프라 관리 포인트 감소가 매력적.
- Dataflow 서비스 이해
- Apache Beam은 배치와 스트리밍 파이프라인을 모두 처리하는 프로그래밍 모델이며, Dataflow는 Beam 모델을 실행하는 프레임워크 중 하나.
- Dataflow 파이프라인은 준비 단계(Queued state)와 실행 단계(Running state)를 거쳐 실행.
- Flex 템플릿은 파이프라인을 패키징하여 재사용 가능한 형태로 만들어 Dataflow 배포를 간소화.
- Dataflow CI/CD 및 설정 팁
- GitHub Actions를 사용하여 템플릿 빌드부터 Dataflow 배포까지의 CI/CD 워크플로우 구축.
- 스트리밍 파이프라인에서는 streaming engine을 사용하여 worker VM 부담을 줄이고, Dataflow service agent에 적절한 역할을 부여하여 권한 문제 해결.
Next Feeds

Spot by NetApp을 활용한 AWS EKS 운영 비용 절감 사례
Spot by NetApp을 활용하여 AWS EKS 운영 비용을 40% 절감한 SK플래닛의 사례를 소개하고, 솔루션의 주요 기능과 적용 방법을 설명합니다.
Spot by NetAppAWS EKS비용 최적화클라우드인스턴스
2023. 4. 9.
skplanet

MinIO 도입기— HA 이해 및 DR 전략 구성
네이버 G플레이스AI개발팀의 MinIO 도입 과정, HA 구성, DR 전략 구축 및 검증 내용을 담고 있습니다.
MinIOHADRErasure CodingHDFS distcp
2023. 4. 6.
네이버플레이스
우당탕탕~ 영상 서비스 개발기 3탄 : 플레이어 백엔드 서버와 데이터 수집
카카오엔터테인먼트 영상 서비스 개발팀의 플레이어 백엔드 서버 개발 및 데이터 수집 과정, 기술 스택, 경험 공유.
GoGCPGKEBigQueryDataflow
2023. 4. 5.
카카오엔터테인먼트FE
우당탕탕~ 영상 서비스 개발기 2탄 : 인코더와 라이브 서비스
카카오엔터테인먼트 영상 서비스 개발팀의 인코더, 라이브 서비스 개발 경험과 기술적 고민, 문제 해결 과정을 공유합니다.
인코딩트랜스코딩라이브 스트리밍패키징Flutter
2023. 4. 4.
카카오엔터테인먼트FE

Yarn 대신 pnpm으로 넘어간 3가지 이유
Yarn에서 pnpm으로 전환한 이유와 pnpm 도입 후 얻은 장점을 분석하고, pnpm이 패키지 관리의 대안이 될 수 있음을 제시합니다.
pnpmYarn패키지 매니저모노레포Ghost Dependency
2023. 4. 3.
AB180
View Transitions API
View Transitions API는 외부 라이브러리 없이 화면 전환 효과를 쉽게 구현하도록 돕는 실험적인 Web API입니다. 간단한 사용법과 다양한 활용 예시를 제공합니다.
View Transitions API트랜지션animationfrontendWeb API
2023. 4. 3.
카카오엔터테인먼트FE