- 애널라이저는 문자열(필드 값)을 토큰으로 변환하는 장치다. ⚙️
- 애널라이저는 캐릭터 필터, 토크나이저, 토큰 필터 세 가지 요소로 구성된다. 🧩
- 캐릭터 필터는 문자열을 다듬는 역할(HTML 태그 제거 등)을 한다. ✂️
- 토크나이저는 문자열을 토큰으로 자르는 역할을 하며, 스탠더드 토크나이저는 공백/문장 부호 기준으로 자른다. 🔪
- 토큰 필터는 잘린 토큰을 최종적으로 다듬는 역할(소문자 변환, 불용어 제거 등)을 한다. ✨
- 엘라스틱서치는 기본 애널라이저 설정을 가지고 있다. ⚙️