S
SSG
December 11, 20241회
VLM, LLM을 사용하여 멀티모달 학습 데이터 제작하기
간단 소개
SSG AI팀은 VLM, LLM을 활용하여 멀티모달 학습 데이터를 저비용으로 구축하고, 쓱렌즈의 검색 정확도를 향상시켰습니다.
AI Summary
- 멀티모달 학습 데이터 제작 배경
- SSG 쓱렌즈의 멀티모달 검색 기능 고도화를 위해 VLM과 LLM을 활용한 학습 데이터 제작 필요성이 대두됨.
- 기존 학습 데이터의 부족한 정보량과 라벨링의 높은 비용 문제를 해결하고자 함.
- VLM, LLM 활용 데이터 제작
- 상품 상세 정보 이미지에서 OCR 기술로 텍스트 추출 후, GPT 3.5 API를 이용해 요약 시도. 부정확한 OCR 결과로 인해 VLM(GPT 4, Gemini) 활용.
- 프롬프트 엔지니어링을 통해 VLM이 상품 이미지와 OCR 데이터의 정합성을 검증하고, 상세 정보를 추출하도록 함.
- 모델 역할 부여, 체계화된 질문, 예시 제공 등의 방법론 적용.
- Gemini 활용 및 결과 후처리
- Gemini API와 Google Vertex AI 플랫폼을 비교 후, 추론 속도와 비용 효율성을 고려하여 Vertex AI 방식 채택.
- Safety Settings 조정, Chat Session 활용, Batch Prediction 적용으로 비용 절감.
- Gemini 결과의 후처리 중요성을 강조하며, 이미지 유사성, 관련 없는 내용 인용, 비일관적인 답변 등의 문제점을 해결.
Next Feeds

WebAssembly(WASM) & WASI 2024 : 크로스플랫폼의 미래
Wasm과 WASI 기술의 발전 방향과 크로스플랫폼 기술로서의 가능성을 제시하며, 미래 컴퓨팅 환경에 대한 전망을 제시합니다.
WebAssemblyWasmWASI크로스플랫폼컴포넌트 모델
2024. 12. 11.
한글과컴퓨터

AI 코딩 도구 개발 결과 비교: Cursor, Windsurf, Aider
AI 코딩 도구 Cursor, Windsurf, Aider를 비교 분석하여 각 도구의 특징과 장단점을 제시하고, 개발 효율성 향상을 위한 도구 선택의 중요성을 강조합니다.
AI 코딩 도구CursorWindsurfAiderReact
2024. 12. 11.
인포그랩

고성능 캐시 아키텍처 설계 - 로컬 캐시와 Redis로 대규모 증정 행사 관리 최적화
올리브영은 증정 행사 시스템의 성능 개선을 위해 로컬 캐시와 Redis를 결합한 다중 레이어 캐시 아키텍처를 구축하여 효율성을 높였습니다.
캐시RedisElastiCacheCaffeine Cache다중 레이어 캐시
2024. 12. 10.
올리브영
지연이체 서비스 개발기: 은행 점검 시간 끝나면 송금해 드릴게요! (feat. 발표 후기)
카카오페이 지연이체 서비스를 Kafka 기반으로 재설계하고 성능을 8배 향상시킨 개발 경험 공유.
지연이체KafkaRabbitMQ아키텍처성능 개선
2024. 12. 10.
카카오페이
TurboRepo Just-in-Time Packages 적용기 Feat. ModuleResolution
Turborepo의 Just-in-Time Packages 적용 과정과 ModuleResolution에 대한 이해, 트러블슈팅 경험을 공유합니다.
TurboRepoJust-in-Time PackagesModuleResolutionTypescript모노레포
2024. 12. 10.
카카오엔터테인먼트FE
TurboRepo Just-in-Time Packages 적용기 Feat. ModuleResolution
TurboRepo의 Just-in-Time Packages 적용 과정과 ModuleResolution에 대한 이해, 트러블슈팅 경험을 공유합니다.
TurboRepoJust-in-Time PackagesModuleResolutionTypescript모노레포
2024. 12. 10.
카카오엔터테인먼트FE