컬
컬리
April 15, 20201회
AWS Sagemaker Ground Truth로 훈련용 이미지를 편하게 분류하자

간단 소개
AWS Sagemaker Ground Truth를 이용한 훈련 이미지 분류 방법과 한계점을 분석하고, 효율적인 데이터 준비 방안에 대한 고민을 제시합니다.
AI Summary
- 머신러닝 모델 개선을 위한 훈련 데이터 준비의 어려움
- 컬리에서 후기 이미지 분류 자동화를 위해 머신러닝을 사용 중이며, 모델 개선을 위해 훈련 데이터 준비 과정에 대한 어려움을 겪음.
- 기존 방식은 수동 분류로 효율성이 낮고, 오류 가능성이 높았음.
- 데이터 정제 및 분류 방법
- S3에 저장된 이미지 데이터를 aws-cli를 통해 로컬로 다운로드하고, 중복 이미지 제거를 위해 해시값을 이용, 잘못된 이미지는 Image 객체를 통해 오류 검출 후 삭제함.
- 드래그 앤 드롭 방식(mark1)과 분류기를 이용한 방식(mark2)을 사용했지만, 대량의 데이터를 처리하기에는 한계가 있었음.
- AWS Sagemaker Ground Truth 활용 및 한계
- AWS Sagemaker Ground Truth를 통해 이미지 분류 자동화 또는 외부 인력을 활용한 수작업 분류를 시도함.
- Ground Truth는 다수 작업자가 편리하게 분류할 수 있도록 지원하지만, 높은 요금으로 인해 실제 도입에는 어려움이 있음.
Next Feeds

Slack Block Kit 활용
Slack Block Kit을 활용하여 메시지에 Action을 추가하고 Spring Framework와 연동하여 효율적인 업무 환경을 구축하는 방법을 소개합니다.
Slack Block KitSlack APISpring FrameworkJava SDK메시지 템플릿
2020. 4. 7.
컬리

React밖에 모르는 당신에게. GatsbyJS한 잔, '채용~'
뱅크샐러드 채용 사이트 개발에 GatsbyJS를 도입한 과정, 장점, 그리고 개발 중 발생한 문제점과 해결 방안을 공유합니다.
GatsbyJSReactSEOJAMstack채용 사이트
2020. 4. 5.
뱅크샐러드

Kurly에서 주문을 모니터링 하는 법
컬리 주문 모니터링 시스템을 Legacy에서 Kafka와 ELK 스택 기반으로 개선한 과정과 경험, 그리고 배포 후 발생한 이슈와 해결 방안을 공유합니다.
KafkaElasticsearchELK모니터링legacy system
2020. 3. 17.
컬리

JIRA를 하자! - 쿠키런 : 오븐브레이크의 JIRA 도입기
쿠키런: 오븐브레이크 팀의 JIRA 도입 및 개선 과정, 효과적인 이슈 관리 시스템 구축을 위한 노력과 경험 공유.
JIRABTS이슈 관리워크플로칸반
2020. 3. 16.
데브시스터즈

집에서 일했을 뿐인데 생산성이 폭발했다
뱅크샐러드는 재택근무 시행 후 생산성이 향상되었으며, 이는 효율적인 규칙, 시스템, 그리고 리더십 덕분이다.
재택근무생산성비동기스탠드업 미팅코드 리뷰
2020. 3. 14.
뱅크샐러드

개발자들이 꺼려하는 까칠한 규식이 형
정규식의 활용과 슬랙 채널을 통한 개발팀 협업으로 특수 문자 제거 문제를 해결한 경험을 공유합니다.
정규식Regular Expression슬랙협업특수 문자 제거
2020. 3. 13.
컬리