- 최신 AI 앱(ChatGPT, GitHub Copilot)은 대화 기억 및 코드 참조를 위해 벡터 데이터베이스를 활용합니다. 💡
- 벡터 데이터베이스는 데이터를 임베딩(숫자 배열) 형태로 저장하여 의미론적 유사성을 표현합니다. 📊
- RAG(검색 증강 생성) 파이프라인에서 LLM에 추가 컨텍스트를 제공하여 답변의 정확도를 높이는 데 필수적입니다. 🚀
- 단순 키워드 검색을 넘어 의미론적 검색, 중복 감지, 개인화된 추천 등 다양한 AI 기능을 지원합니다. 🎯
- MongoDB Atlas는 기본적으로 벡터 검색 기능을 내장하여 별도의 벡터 데이터베이스 없이 통합 솔루션을 제공합니다. 🔗
- MongoDB는 ACID 준수 및 트랜잭션을 지원하여 기존 데이터베이스의 신뢰성을 유지합니다. ✅
- 임베딩 모델은 텍스트를 수치 벡터로 변환하며, 의미가 유사한 텍스트는 벡터 공간에서 가깝게 위치합니다. 🧠
- 대량의 텍스트는 청킹 과정을 거쳐 임베딩 모델로 처리된 후 벡터 데이터베이스에 저장됩니다. 📖
- **근접 이웃 검색(ANN) 알고리즘(예: HNSW)**을 사용하여 데이터베이스 내에서 가장 유사한 벡터를 효율적으로 찾아냅니다. ⚡
- MongoDB Atlas의 집계 파이프라인을 통해 벡터 검색과 일반 필터링을 결합하여 복합적인 쿼리를 수행할 수 있습니다. 🛠️





