- 엠베딩은 텍스트를 숫자로 변환하는 과정으로, 토큰 분해, 어휘 사전 매핑, 길이 조정(확장/축소)을 포함한다. 🧮
- 엠베딩 모델은 토큰 분해, 어휘 사전, 엠베딩 변환 공식을 결합한 것으로, 텍스트 엠베딩을 위해 별도로 존재한다. 🧩
- 특정 엠베딩 모델로 구축된 RAG DB는 다른 모델로 호환되지 않으므로, 모델 선택 시 신중해야 하며 모델 교체 시 DB 전체를 재구축해야 한다. ⚠️
- 질의 분해는 복잡한 질의를 여러 개의 팩트 기반 질의로 분리하여 RAG 시스템의 검색 정확도를 높이는 기법이다. 🔍
- 질의 분해 시, 사용자 의도가 담긴 질의를 팩트 기반(A는 B 형태)으로 변환해야 RAG DB의 정보와 일치도를 높일 수 있다. 🎯
- LM을 활용하여 질의를 팩트 기반으로 분해하면, RAG 시스템에서 더 높은 정확도로 정보를 검색할 수 있다. 🤖





