- RAG 검색의 문제점은 인베딩 불일치이며, 이를 보완하는 것이 중요합니다. 🧩
- 인코더 기반 인베딩 모델은 구형 어텐션 기술을 사용해 시맨틱 정보가 부족합니다. 🤖
- 사용자 질의는 의도와 컨텍스트를 포함하지만, 데이터는 팩트 기반이라 불일치가 발생합니다. 🗣️
- 인베딩 외에는 시맨틱 검색 대안이 없으며, 멀티모달 데이터에도 적용 가능합니다. 🖼️
- 문서 압축, 키워드 검색, 부모 문서 추가 검색 등으로 인베딩을 보완할 수 있습니다. 📚
- LLM을 사용해 사용자 질의를 데이터에 맞게 변형하거나, 데이터 기반 질문을 생성해 임베딩합니다. ❓
- 벡터 DB는 메타데이터 필드, 키워드, 풀텍스트 인덱스 등 추가 기능을 제공합니다. 🗄️
- 시간 요소를 고려해 오래된 데이터를 갱신하고, 우선순위를 부여해 벡터 DB를 관리해야 합니다. ⏰
- 리랭커는 LLM을 사용해 검색 결과의 유사성을 재평가하여 순위를 조정합니다. 🥇
- 랩터는 청크들을 군집화하고 요약하여 임베딩을 생성하지만, 실제 효과는 제한적일 수 있습니다. 🕸️