- EKS에서 GPU를 사용하려면 워커 노드에 NVIDIA 드라이버와 컨테이너 툴킷 설치가 필수! ⚙️
- 쿠버네티스가 GPU를 인식하도록 NVIDIA 디바이스 플러그인을 데몬셋 형태로 배포해야 함. 🔌
- GPU 오퍼레이터를 사용하면 드라이버 설치, 툴킷 설정, 플러그인 배포, 모니터링까지 통합 관리 가능. 📦
- 파드 스펙에서
nvidia.com/gpu
리소스를 요청하여 GPU를 할당받을 수 있음. 🕹️ - 올라마(Ollama)는 다양한 오픈소스 LLM을 쉽게 실행할 수 있게 해주는 도구. 🦙
- GPU 타임 슬라이싱을 통해 하나의 GPU를 여러 컨테이너가 공유하여 비용 효율성을 높일 수 있음. ⏱️
- 칼펜터(Karpenter)를 사용하여 GPU 워크로드에 따라 노드를 자동으로 스케일링할 수 있음. 🔨
- AI 작업, 예산, 성능, 관리 복잡성 사이의 균형점을 찾는 것이 중요. ⚖️