A
AWS
October 27, 20252회
Amazon EKS에서vLLM Deep Learning Container를 사용하여LLM 배포하기

간단 소개
Amazon EKS에서 vLLM 딥 러닝 컨테이너를 사용하여 GPU, EFA, FSx for Lustre 기반의 확장 가능하고 고성능 LLM 추론 시스템을 배포하는 방법을 설명합니다.
AI Summary
-
vLLM DLC를 활용한 LLM 배포 간소화
- 대규모 언어 모델(LLM) 배포의 GPU 활용, 네트워크, 분산 추론 과제를 해결하기 위해 vLLM 라이브러리와 **vLLM AWS 딥 러닝 컨테이너(DLC)**가 사용됩니다.
- DLC는 EKS, ECS, EC2에 최적화된 사전 구성 환경으로, EFA(Elastic Fabric Adapter) 지원을 포함하여 환경 구축 및 성능 튜닝 복잡성을 줄입니다.
-
Amazon EKS 기반 고성능 LLM 추론 아키텍처
- 솔루션은 Amazon EKS, GPU 지원 EC2(P4d.24xlarge), EFA 네트워킹, Amazon FSx for Lustre 스토리지를 활용합니다.
- **ALB(Application Load Balancer)**를 통해 클라이언트 요청이 EKS 노드의 vLLM 서버 파드로 전달되며, FSx for Lustre의 모델 가중치에 접근합니다.
- LeaderWorkerSet 패턴과 AWS Load Balancer Controller를 사용하여 확장 가능하고 고성능 LLM 추론 시스템을 구축하며, EFA와 FSx for Lustre로 성능을 최적화합니다.
Next Feeds

대규모 EC2 환경에서의 운영 전략 : EBS Initialization 자동화 MCP 서버 구현 및 연동
대규모 EC2 환경에서 EBS 볼륨 초기화의 비효율성을 해결하기 위해 AI 에이전트와 연동되는 MCP 서버를 구현하여 자동화 및 운영 효율성을 극대화하는 솔루션.
EBS 초기화MCP 서버AI 에이전트EC2 환경자동화
2025. 10. 27.
AWS

Health Check로 구축하는 장애 대응 자동화
Kubernetes 환경에서 Health Check를 활용한 장애 대응 자동화 방법을 Liveness, Readiness, Startup Probe 중심으로 설명하고 구현 가이드라인을 제시합니다.
KubernetesHealth CheckLiveness ProbeReadiness ProbeStartup Probe
2025. 10. 27.
한글과컴퓨터

배송 완료 사진 속 객체 탐지를 통한 수기 검수 비용 줄이기
컬리는 AI 기반 객체 탐지 모델(YOLOv11)을 활용하여 배송 완료 사진 속 퍼플 박스와 종이봉투를 자동 검수, 수기 검수 비용을 93% 절감하고 배송 품질을 향상시켰다.
객체 탐지퍼플 박스종이봉투수기 검수 비용 절감Data-centric AI
2025. 10. 27.
컬리

DAN25의 참가신청이 시작됩니다. (10월 27일, 28일 양일간)
팀네이버 컨퍼런스 DAN25의 참가신청이 10월 27일, 28일 양일간 선착순으로 진행되며, NFT 티켓과 35개 기술세션을 제공합니다.
DAN25참가신청팀네이버 컨퍼런스기술세션네이버페이 월렛
2025. 10. 24.
Naver d2
SageMaker AI로 해보는 GPT-OSS 추론 성능 테스트와 용량 산정
Amazon SageMaker AI 환경에서 GPT-OSS 120B 모델의 LLM 추론 성능 테스트, 최적화 기법, 용량 산정 및 vLLM/SGLang 벤치마크 결과를 분석합니다.
SageMaker AIGPT-OSSLLM 추론vLLMSGLang
2025. 10. 24.
AWS
기기 없이 앱을 테스트하는 법, 멀티버스가 알려드립니다
카카오페이의 멀티버스는 가상 기기를 통해 앱 테스트 환경 구축 및 관리를 간소화하여 개발 효율성을 높이는 macOS 앱입니다.
멀티버스가상 기기앱 테스트macOS 앱테스트 편의 기능
2025. 10. 23.
카카오페이