rag llm - 온라인 서비스에 AI 적용하는 방법 [개발일기]
- RAG(Retrieval Augmented Generation)는 LLM의 한계를 보완하는 기술입니다. 💡
- 워드 임베딩은 단어를 벡터로 표현하여 유사도를 계산하는 기술입니다. 🐱
- OpenAI 임베딩 API는 스몰 모델과 라지 모델을 제공하며, 가격과 성능을 고려해야 합니다. 💲
- 벡터 DB는 고차원 벡터 데이터를 효율적으로 저장하고 검색하는 데이터베이스입니다. 🗄️
- Pinecone과 Weaviate는 추천할 만한 벡터 DB입니다. 👍
- RAG 프로세스는 유저 입력을 받아 임베딩하고, 벡터 DB에서 유사도 검색을 통해 LLM에 적절한 컨텍스트를 제공합니다. 🔎
- 벡터 DB의 유사도 검색은 정확한 키워드 매칭이 아닌 유사한 내용을 순차적으로 제공합니다. 🔄
- RAG는 LLM의 자연어 이해 능력을 활용하여 다양한 서비스에 응용될 수 있습니다. 🤖
- 과거 인텐트 클래시피케이션 방식과 비교하여 RAG는 자연어 처리의 효율성을 크게 향상시켰습니다. 🗣️
- 벡터 DB의 관리 및 모니터링이 RAG 시스템의 성능에 중요한 역할을 합니다. ⚙️