- NanoNets OCR Small은 3B 모델로, Qwen 2.5 VL 모델을 기반으로 함. 🤯
- 기존 OCR 모델 대비 LaTeX 수식 인식, 이미지 설명, 서명 감지 등 다양한 특화 기능을 제공. ✍️
- 25만 페이지 분량의 연구 논문, 금융 문서, 법률 문서 등으로 구성된 데이터 세트로 미세 조정됨. 📚
- 작은 모델 크기로 휴대폰에서도 실행 가능하며, 온프레미스 환경에서 데이터 유출 없이 사용 가능. 📱
- Mistral OCR과 비교했을 때, 특정 작업에서 더 나은 성능을 보임. 🏆
- 향후 더 작은 모델에서도 고성능 OCR 시스템이 등장할 가능성이 높음. 🔮