- 초고속 웹사이트 크롤링: 몇 초 만에 웹사이트 전체를 LLM이 이해할 수 있는 형태로 변환 🚀
- 깔끔한 마크다운 변환: 지저분한 HTML을 사람과 LLM이 모두 이해하기 쉬운 마크다운으로 변환 ✍️
- 불필요한 콘텐츠 제거: 스크립트 태그 및 중복 정보 제거로 효율적인 지식베이스 구축 🧹
- 간편한 설치 및 사용: pip install 및 간단한 명령어로 쉽게 사용 가능 🛠️
- 오픈소스 및 효율적인 자원 사용: 무료 오픈소스이며 메모리 효율적 💡
- 다양한 기능 지원: 프록시 및 세션 관리 등 다양한 기능 지원으로 편리성 증대 🌐
- Playwright 기반: 안정적이고 강력한 웹 스크래핑 라이브러리 활용 💪
- GitHub 레포지토리 제공: 코드 공유 및 참고 용이 🔗