- Dockling은 문서에서 데이터를 추출하는 데 도움을 줍니다. 📄
- 또한, LLM을 위한 데이터 준비 과정에서 중요한 '청킹(chunking)' 작업을 지원합니다. ✂️
- 전체 문서를 벡터 데이터베이스에 직접 넣는 것은 LLM이 RAG를 통해 한 번에 검색하기에 너무 많기 때문에 청킹이 필수적입니다. 🧠
- 특히 큰 문서의 경우, LLM이 질문에 답하는 데 필요한 특정 단락이나 불릿 포인트 목록만 검색할 수 있도록 문서를 작은 정보 조각으로 분할해야 합니다. 🧩
- 효과적인 청킹의 핵심 과제는 정보 경계를 정의하는 것이지만, Dockling은 다양한 전략을 통해 이 기술적 문제를 쉽게 해결해 줍니다. ✨





