- RAG는 검색(Retrieval), 증강(Augmented), 생성(Generation)의 약자로, 검색된 정보를 활용하여 생성 모델의 성능을 향상시키는 기술입니다. 🔍
- RAG에서 '리트리벌'은 텍스트를 특정 차원의 벡터로 임베딩하고, 유사한 벡터를 찾아 연결된 정보를 가져오는 과정을 의미합니다. 🔢
- RAG는 생성 자체를 강화하는 것이 아니라, 검색된 정보를 바탕으로 컨텍스트를 강화하여 LLM의 답변 품질을 높입니다. 💡
- LLM과 리트리버는 독립적으로 작동하며, 리트리버는 GPU 자원을 사용하지 않습니다. ⚙️
- 엠베딩 모델은 텍스트를 특정 차원의 벡터로 변환하는 역할을 하며, LLM 모델과는 별도로 존재합니다. 🤖
- 엠베딩 모델을 변경하면 기존 RAG DB 전체를 다시 엠베딩해야 하므로, 신중하게 선택해야 합니다. ⚠️
- 질의 분해 기법은 복잡한 질의를 여러 개의 간결하고 팩트 기반의 질의로 분해하여 RAG 시스템의 검색 정확도를 높이는 방법입니다. 쪼개기 ✂️
- 랭체인은 RAG 구축을 위한 파이프라이닝 라이브러리이지만, 상용 서비스에는 적합하지 않을 수 있습니다. 🚧