N
Naver d2
July 15, 20251회
Ray를 활용한 GPU Util 100% MLOps: 배치처리부터 모델 서빙까지

간단 소개
Ray를 활용하여 GPU 활용률을 극대화하고, 확장 가능한 모델 서빙 아키텍처를 구축하는 MLOps 기법을 소개합니다.
AI Summary
- Ray 소개 및 핵심 아키텍처
- Ray는 AI/ML 분산 처리 프레임워크로, GPU 활용률을 극대화하는 데 사용된다.
- Ray Data를 활용한 배치 추론과 Ray Serve를 이용한 모델 서빙 아키텍처를 구축한다.
- GPU 활용률 극대화를 위한 배치 처리
- 기존 구조의 문제점을 해결하고, PipelineStep 추상 클래스를 도입하여 배치 파이프라인을 개선한다.
- Troubleshooting 사례를 통해 실제 문제 해결 과정을 공유한다.
- Ray Serve를 활용한 LLM 배포
- ServeManager를 통해 LLM을 효율적으로 배포하고 관리한다.
- vLLM을 기반으로 LLM 추론 파이프라인을 구성하고 확장한다.
Next Feeds

iOS 앱 사이즈 줄이기
iOS 앱 사이즈 줄이기를 통해 다운로드 전환율을 높이는 방법과 알라미 앱 최적화 사례를 소개합니다. 이미지 최적화, 중복 제거 등을 통해 앱 크기를 줄일 수 있습니다.
앱 사이즈다운로드 전환율이미지 최적화TinyPNGEmergetools
2025. 7. 14.
딜라이트룸

슬기로운 토스뱅크 개발 인턴 생활
토스뱅크 개발 인턴의 개발 문화 경험, 주요 프로젝트 소개 (변수명 플러그인, SecretToString 플러그인), 그리고 토스에서의 성장 과정을 담고 있습니다.
토스뱅크인턴개발 문화플러그인백엔드
2025. 7. 14.
토스

Amazon Bedrock을 활용한 MCP 허브 아키텍처로 기업의 AI 시스템 비즈니스 민첩성 가속화
Amazon Bedrock을 활용한 중앙 집중식 MCP 서버 구현으로 기업 AI 시스템의 민첩성을 가속화하고 운영 효율성을 향상시킬 수 있습니다.
Amazon BedrockMCP생성형 AI에이전트금융 서비스
2025. 7. 14.
AWS

실패도 빠르게! 100개 배너 10초컷 테스트 자동화 구현기
29CM 배너 테스트 자동화 구현 과정: UI 자동화에서 API 테스트로 전환하여 효율성을 극대화하고, 빠른 피드백과 커뮤니케이션의 중요성을 강조.
테스트 자동화배너 테스트API 테스트PlaywrightRequests
2025. 7. 13.
무신사

2025 하반기 NEW! 기술 세미나 & 컨퍼런스 일정 정리! (ver.250713)
2025년 하반기 국내외 주요 기술 컨퍼런스 및 세미나 일정을 정리하고, 다양한 분야의 행사 정보를 제공합니다.
컨퍼런스세미나기술개발자일정
2025. 7. 13.
skplanet

Kubernetes GPU 클러스터에서 AI 서비스 오토스케일링하기
NAVER ENGINEERING DAY 2025에서 발표된 SNOW의 쿠버네티스 GPU 클러스터 기반 AI 서비스 오토스케일링 사례 소개.
쿠버네티스GPU오토스케일링AI 서비스KEDA
2025. 7. 11.
Naver d2