- AI 에이전트의 정확성을 위해 벡터 데이터베이스를 최신 상태로 유지하는 RAG 파이프라인 구축의 중요성을 강조합니다. 💡
- 데이터 파이프라인은 원본 자료, 처리 과정, 최종 저장소의 세 단계로 구성됩니다. ⚙️
- 파이프라인의 네 가지 핵심 구성 요소는 트리거, 입력, 처리, 저장소입니다. 🧩
- Google Drive에 PDF 파일이 생성, 업데이트, 삭제될 때 Superbase 벡터 데이터베이스에 자동으로 반영되는 실제 파이프라인 구축 과정을 시연합니다. 📂
- 파일 업데이트 시 기존 벡터를 삭제하고 새로운 벡터를 추가하는 방식으로 데이터베이스의 일관성을 유지합니다. 🔄
- 파일 이름, 날짜 등 고유한 메타데이터를 활용하여 벡터 데이터베이스 내의 파일을 효율적으로 관리하고 업데이트/삭제를 용이하게 합니다. 🏷️
- PDF, Word, Excel 등 다양한 파일 형식을 처리할 수 있도록 유연한 파이프라인 설계의 필요성을 설명합니다. 🗂️
- 구축된 파이프라인을 통해 업데이트된 정보를 RAG 에이전트가 정확하게 질의하고 응답하는 것을 검증합니다. ✅





