컬
컬리
October 25, 20221회
Kurly만의 MLOps 구축하기 - 초석 다지기

간단 소개
컬리 MLOps 구축 초석 다지기: Karpenter를 활용한 GPU 자동 프로비저닝 및 디프로비저닝 환경 구축 과정을 소개합니다.
AI Summary
- MLOps 도입 배경 및 필요성
- 컬리도 ML 앱 증가로 운영 부담이 커져 MLOps에 대한 필요성이 대두됨
- 기존 환경(Airflow, JupyterHub, MLFlow)은 독립적 운영, 특히 GPU 자원 관리의 어려움 존재
- 통합 환경 및 자동 GPU 프로비저닝/디프로비저닝 필요
- Karpenter를 활용한 GPU 환경 구축
- Karpenter는 Kubernetes Worker Node 자동 확장 오픈소스 프로젝트로, 기존 Auto Scaling 대체 가능
- Karpenter는 신규 Pod를 감지, Worker Node를 자동 추가/삭제하여 비용 효율화 및 운영 부담 최소화
- Provisioner를 통해 노드 프로비저닝 제약 조건, timeout 설정 등을 관리하고, GPU 요구 사항을 설정하여 GPU 서버 프로비저닝
- GPU Deprovisioning 및 추가 설정
- **NVDP(NVIDIA device plugin for Kubernetes)**를 통해 GPU 노드에 Nvidia 관련 설정 필요
- Affinity 설정을 통해 GPU 미사용 파드가 GPU 노드에 할당되는 것을 방지하여 Deprovisioning 문제 해결
- Karpenter Consolidation 옵션을 사용하여 노드 관리 자동화 (CRD 업그레이드 필요)
Next Feeds

What AI Art can tell us about the future of Design and how it can affect Ad creative optimization
AI 아트는 디자인, UX, 광고 크리에이티브 최적화에 혁신적인 변화를 가져올 잠재력을 지니고 있습니다.
AI 아트디자인프롬프트UX광고 최적화
2022. 10. 24.
버즈빌

Scala for Game Server Development
Scala는 강력한 타입 시스템, DSL, 동시성 지원으로 게임 서버 개발에 적합하며, 코드 안정성과 개발 효율성을 높인다.
Scala게임 서버DSL동시성타입 시스템
2022. 10. 24.
데브시스터즈

게임 서버 개발에 스칼라 사용하기
스칼라를 사용하여 게임 서버를 개발하면서 얻은 이점과 경험을 공유하고, 스칼라의 강력한 기능과 활용 사례를 소개합니다.
스칼라게임 서버정적 타입DSL동시성
2022. 10. 24.
데브시스터즈
Terraform IaC 도구를 활용한 AWS 웹콘솔 클릭 노가다 해방기
사람인에서 테라폼을 도입하여 AWS 웹 콘솔 작업의 비효율성을 개선하고 IaC 환경을 구축한 경험을 공유합니다.
TerraformIaCAWS클라우드자동화
2022. 10. 21.
사람인
티맵은 어떻게 지도 데이터를 구축할까? - 15편 - 티맵러들의 빠르고 안전한 운행을 위하여
티맵은 사전 정보 수집, 현장 조사, AI 영상인식 기술을 활용하여 지도 데이터를 구축하고, 사용자에게 빠르고 안전한 운행을 지원합니다.
티맵지도 데이터내비게이션현장 조사영상인식
2022. 10. 20.
티맵모빌리티
React 컴포넌트와 추상화
React 컴포넌트 추상화 전략을 통해 재사용성, 유지보수성, 확장성을 높이는 방법을 제시합니다.
React컴포넌트추상화재사용성책임 분리
2022. 10. 20.
카카오엔터테인먼트FE