요
요기요
July 21, 20241회
요기요 검색에서 형태소 분석기의 한계와 극복

간단 소개
요기요 검색에서 형태소 분석기의 한계를 N-gram을 통해 극복하고 검색 정확도를 향상시킨 사례를 소개합니다.
AI Summary
- 형태소 분석기의 한계
- 요기요 검색은 가게 이름 검색에 특화되어 있어, 문법에 특화된 형태소 분석기로는 한계가 있음.
- 가게 이름은 문법적으로 어긋나거나 독특하게 지어지는 경우가 많아 형태소 분석이 어려움.
- 형태소 분석은 서로소 분할 방식으로 작동하여, 음절 공유가 필요한 경우 분석이 어려움.
- 사전에 없는 형태소(신조어, 줄임말, 외래어 등)는 분석이 불가능하며, 새로운 형태소가 등장할 때마다 사전에 등록해야 함.
- N-gram을 통한 한계 극복
- 형태소 분석기 기반 Analyzer와 N-gram Analyzer를 함께 사용하여 단점을 보완함.
- 색인 시에는 2-gram부터 사용하여 불필요한 매칭을 방지하고, 쿼리 시에는 형태소 분석기 기반 Analyzer를 사용함.
- 쿼리문 전체를 term으로 추출하여 색인 term과 매칭되도록 추가하여, 한 글자 term 매칭 문제를 해결함.
- 개선 결과
- 형태소 분석기 오분석으로 인한 검색 미노출 CS가 2분기에 0건을 기록하며 100% 감소함.
- 플랫폼 특성에 맞는 Analyzer 설계가 중요함을 강조함.
Next Feeds

Custom Style System 구축하기
크리에이트립 프론트엔드 개발자가 Custom Style System 구축 경험을 공유하며, 필요성, 원칙, 구축 과정 및 결과를 설명합니다.
스타일 시스템styled-componentsCSS-IN-JS컴포넌트인터페이스
2024. 7. 18.
크리에이트립
강력한 시각화 툴로 자리잡은 피그마 - 필수기능
피그마의 핵심 기능인 오토 레이아웃, 크기 조절 옵션, 컴포넌트 활용법을 통해 디자인 효율성을 높이는 방법을 소개합니다.
피그마오토 레이아웃컴포넌트디자인UX
2024. 7. 18.
현대자동차
카카오페이 배포 효율화 1년 회고: 자동화 도입과 팀 생산성 향상
카카오페이 SRE팀의 배포 자동화 사례: 인원 감축, 생산성 향상, 그리고 개선 과제를 솔직하게 공유합니다.
자동화배포SRE슬랙봇회고
2024. 7. 17.
카카오페이

출고준수율 개발기: 정의부터 구현 및 성능 개선까지
29CM의 출고준수율 개발 및 개선 과정을 담은 글. 정의, 소통 문제 해결, 캐시 적용 실패, 쿼리 병렬 호출, Materialized View 적용을 통한 성능 개선 과정을 설명한다.
출고준수율Materialized View캐시쿼리 성능병렬 처리
2024. 7. 17.
29cm
jcenter, 이제 문 닫습니다
jcenter 서비스 종료에 따른 영향과 개발자의 대응 방안을 안내합니다. mavenCentral로의 이전 및 라이브러리 버전 업데이트가 필요합니다.
jcentermavenCentralbintrayGradle라이브러리
2024. 7. 17.
지마켓
Hexagonal Architecture?
헥사고날 아키텍처의 개념, 전통적 아키텍처와의 차이점, 그리고 패키지 분리를 통한 개선 방안을 설명합니다.
헥사고날 아키텍처클린 아키텍처도메인 주도 개발의존성 역전인터페이스 격리 원칙
2024. 7. 17.
현대자동차