- RAG 모델 성능 향상을 위해 불필요한 내용을 줄이면 좋음 🦥
- 문서가 너무 길면 중요한 정보를 찾기 어려워지고, 불필요한 문장들은 성능 저하와 연산 비용 증가로 이어질 수 있습니다 😟
- 'Neef'는 불필요한 정보를 제거하여 문서의 길이를 압축하는 방법을 제시합니다 🗜️
- Neef는 'Sub', 'Steve' 두 가지 압축 방식을 활용하며, Sub는 중요 문장을 추출하고, Steve는 새로운 머리글을 생성하여 문서를 요약합니다 📑
- Neef를 통해 문서 길이를 줄이면 언어 모델링 성능과 오픈 도메인 QA 성능이 향상됩니다 🚀
- 단순히 문서 길이를 줄이는 것 이상으로 'Oracle'과 같은 압축 방식을 사용하면 더욱 효과적인 성능 향상이 가능합니다 🪄