네
네이버DnA팀
January 25, 20241회
머신러닝을 활용한 검색 품질 지표 개발 (SIGIR’23 Paper Recap)

간단 소개
네이버 Data&Analytics 팀이 개발한 머신러닝 기반 검색 품질 지표(SQM) 개발 과정과 활용 사례, 성과를 소개합니다.
AI Summary
- 검색 품질 평가의 어려움
- 질의어, 사용자, 시간에 따라 평가 기준이 달라짐
- 관련성, 신뢰성, 시의성 등 다양한 척도 존재
- 검색 결과 유형에 따라 사용자 행동 해석이 달라짐
- Data&Analytics 팀의 검색 품질 지표 (SQM) 개발
- 사용자 로그 기반의 User Success/User Effort 시그널 활용, 머신러닝 모델로 결합
- EBM (Explanable Boosting Model) 모델을 사용하여 비선형적인 관계 발견 및 해석 가능성 확보
- 검색 유형 (정답형 vs 탐색형)에 따라 다른 기준으로 만족도 계산
- SQM의 활용 및 성과
- 네이버 검색 품질 KPI 및 온라인 실험 의사결정 지표로 활용
- 특정 질의 및 사용자군에 대한 검색 결과 품질 문제 개선에 기여
- AUROC 0.68 수준의 성능을 보이며, 개선 잠재력이 높은 질의 발견
Next Feeds

버즈빌의 ML 플랫폼 Buzzflow (1) - 모델을 개발하고 관리하기
버즈빌의 ML 플랫폼 Buzzflow는 머신러닝 모델 개발, 관리, 배포를 위한 통합 환경을 제공하여 생산성을 향상시킨다.
MLOps머신러닝 파이프라인SagemakerMLFlowYAML
2024. 1. 25.
버즈빌

올리브영은 인시던트를 어떻게 관리하고 있는가?
올리브영의 인시던트 관리 정책 수립 배경, 과정, 발생 시 대응, 그리고 처리 후 재발 방지 활동에 대한 전반적인 내용 요약.
인시던트USECASECSP슬랙재발 방지
2024. 1. 24.
올리브영
RLHF - 어떻게 LLM의 성능을 향상시킬 수 있을까?
RLHF는 LLM의 성능을 향상시키기 위해 사람의 피드백을 활용하는 강화 학습 방법이며, DPO 등의 대안도 존재한다.
RLHFLLMSFTReward ModelDPO
2024. 1. 24.
빅웨이브에이아이
LangChain: LLM 서비스를 어떻게 개발할 수 있을까?
LangChain 프레임워크 소개 및 LLM 서비스 개발 방법, 다양한 활용 예시와 향후 전망을 제시합니다.
LangChainLLM프레임워크OpenAIAgent
2024. 1. 24.
빅웨이브에이아이
Next.js에서 MSW(Mock Service Worker)로 네트워크 Mocking하기
Next.js 환경에서 MSW를 도입하여 네트워크 Mocking 문제를 해결하고 개발 효율성을 높인 경험과 팁을 공유합니다.
MSWNext.jsMocking프론트엔드테스트
2024. 1. 23.
올리브영
실전에서 TDD하기
카카오페이 개발자가 TDD를 실전에서 적용하며 얻은 경험과 방법론, 그리고 TDD 적용 시 고려사항을 공유합니다.
TDD테스트 주도 개발단위 테스트리팩터링일급 컬렉션
2024. 1. 23.
카카오페이