요
요기요
May 27, 20241회
검색엔진의 Analyzer, 형태소분석기 ≠ 토크나이저

간단 소개
검색 엔진의 분석 과정(Analysis)과 형태소 분석기, 토크나이저의 차이점을 설명하고, Term이 생성되는 과정을 다룬다.
AI Summary
- 검색 엔진의 분석 과정 (Analysis)
- Character-Filtering: 문자 단위로 불필요한 문자 제거 또는 변경하여 검색의 일관성 및 정확성 향상 (예: café → cafe).
- Tokenizing: 정제된 원문에서 Tokenizer를 사용하여 Token 추출. 형태소 분석기를 활용하여 형태소 단위로 분리 후 어절 형성 및 토큰화 진행.
- Token-Filtering: Token 단위로 동의어 처리, 불필요한 토큰 제거 등을 수행하여 검색 품질 향상.
- 형태소 분석기 vs 토크나이저
- 형태소 분석기는 원문을 형태소 단위로 분리하는 역할만 수행.
- 토크나이저는 형태소 분석을 포함하여, 사용자 의도에 맞는 토큰을 생성하기 위해 추가적인 작업(합치거나 지우는 작업)을 수행. 즉, 형태소 분석기 ⊆ 토크나이저.
- Term의 생성
- 분석 과정을 거쳐 최종적으로 생성된 Token이 검색에서 활용되는 Term이 됨.
Next Feeds

함께 구매하면 좋은 상품이에요! - 장바구니 추천 개발기 2부
컬리의 장바구니 추천 시스템 개발 및 실시간 서빙 아키텍처 구축, 운영 경험 공유: 아키텍처, API, MLOps, 배포 전략, 향후 과제 포함.
추천 시스템실시간 서빙MLOps무중단 배포Torchserve
2024. 5. 27.
컬리
iOS 멀티 프레임워크 환경에서 리소스 효율적으로 관리하기
iOS 멀티 모듈 환경에서 리소스 모듈 도입 및 자동화를 통해 앱 용량 최적화 및 유지보수 효율성을 개선한 경험 공유.
iOS멀티 모듈리소스 관리앱 용량자동화
2024. 5. 23.
카카오페이

올리브영 QA의 AWS Lambda를 통한 On call 도입기
올리브영 QA팀은 AWS Lambda를 활용하여 On-call 시스템을 구축, 장애 대응 속도를 높이고 관리 효율성을 개선했습니다.
AWS LambdaOn-callJira서버리스인시던트 관리
2024. 5. 20.
올리브영

함께 구매하면 좋은 상품이에요! - 장바구니 추천 개발기 1부
컬리 장바구니 추천 시스템 개발기로, BERT4Rec 모델과 NPMI를 활용해 보완재 추천을 구현하고 A/B 테스트로 효과를 검증한 사례를 소개합니다.
BERT4Rec추천 시스템보완재NPMIA/B 테스트
2024. 5. 20.
컬리

요기요 채널링 서비스 런칭 회고
요기요 채널링 서비스 런칭 회고: API Gateway 패턴 기반 마이크로서비스 구축, 파트너사별 맞춤 기능 제공, 패키지 구조 설계 경험 공유.
채널링 서비스API Gateway마이크로서비스패키지 구조파트너사
2024. 5. 12.
요기요

선물 받는 모든 순간을 세심하게 케어할게요
롯데ON은 선물하기 서비스에서 선물 받는 사람의 경험을 개선하여 고객 만족도를 높이고 긍정적인 브랜드 이미지를 구축하고자 했습니다.
선물하기롯데ON사용자 경험수락률개선
2024. 5. 9.
롯데ON