네
네이버플레이스
July 13, 20231회
ML gpu model server 성능을 유지하며 cpu server로 전환한 경험 공유

간단 소개
G플레이스AI개발팀의 GPU 모델 서버를 CPU 서버로 전환하여 성능을 유지하고 비용을 절감한 경험 공유.
AI Summary
- 문제 정의 및 배경
- G플레이스AI개발팀은 AI 모델을 활용하여 서비스 개선을 목표.
- 한정된 GPU 자원으로 인해 기존 모델을 CPU serving으로 전환 필요.
- 비용 절감 및 성능 유지가 핵심 목표.
- 개선 과정
- Engineering 최적화: TorchServe worker 조정 시 thread 문제 해결, ipex를 통한 core pinning 적용.
- Model 경량화: Knowledge Distillation(KD) 기법을 사용하여 모델 크기 축소 및 정확도 유지.
- 최종 결과: 음식 사진 분류기 84rps, 이미지 점수 측정기 62rps, 영수증 분류기 111.8rps 달성.
- 결론 및 효과
- Traffic mirroring을 통해 안정적인 검증 후 production 적용.
- GPU 자원 절약 및 연간 약 4억원의 비용 절감 효과.
- 확보된 GPU 자원을 활용하여 AI 서비스 지속적 발전 계획.
Next Feeds

초분광 기술과 IoT의 접목 사례
초분광 기술은 AI와 결합하여 다양한 산업 분야에서 품질 관리, 불량 검출, 공정 자동화 등에 활용될 수 있으며, 자동화 및 효율성 향상에 기여한다.
초분광AI데이터 큐브딥러닝불량 검출
2023. 7. 11.
skplanet
실무에서 적용하는 테스트 코드 작성 방법과 노하우 Part 1: 효율적인 Mock Test
효율적인 Mock Test를 통해 테스트 코드 작성 생산성을 높이고, 유지보수성을 확보하는 방법을 제시합니다.
테스트 코드Mock TestMockBeanTestConfigurationjava-test-fixtures
2023. 7. 10.
카카오페이
![[여기보기] WAS의 정보는 개인정보 다루듯이 보호하라](https://netmarble.engineering/wp-content/uploads/2023/07/preview.png)
[여기보기] WAS의 정보는 개인정보 다루듯이 보호하라
WAS 정보는 개인정보처럼 중요하게 다뤄야 하며, 불필요한 파일 제거, HTTP 응답 헤더 수정, HTTP 상태 코드 메시지 관리 등을 통해 보호할 수 있다.
WAS보안HTTP 응답 헤더HTTP 상태 코드정보 보호
2023. 7. 5.
넷마블

서비스 기획자의 뷰티컬리로 확장하기
컬리의 뷰티컬리 확장 과정에서 서비스 기획자의 역할과 우선순위 설정, 협업 전략을 분석합니다.
뷰티컬리서비스 기획분할 정복고객 여정협업
2023. 7. 5.
컬리

사운드 리소스 전달 WebApp 만들기
게임 리소스 전달을 위한 Web App 개발 경험 공유: 단순한 설계로 사용자 부담을 줄이고 효율적인 버전 관리를 가능하게 함.
리소스 전달버전 관리Web AppNext.jsGit
2023. 7. 4.
데브시스터즈

2023년 상반기, 우리는 정말 큰 과자를 선물로 받았습니다.
올리브영 디지털 사업본부에서 준비한 깜짝 과자 선물 이벤트를 통해 즐거운 회사 분위기를 공유하고, 팀워크를 다지는 모습이 담겨있다.
올리브영디지털 사업본부과자 선물팀워크기업 문화
2023. 6. 30.
올리브영