유튜브블로그Top 10
내 프로필

데브허브 안내
소개업데이트 소식

데브허브 커뮤니티

NanoNets OCR-s

Sam Witteveen

2025. 6. 20.

0

#ai
#frontend
  • NanoNets OCR Small은 3B 모델로, Qwen 2.5 VL 모델을 기반으로 함. 🤯
  • 기존 OCR 모델 대비 LaTeX 수식 인식, 이미지 설명, 서명 감지 등 다양한 특화 기능을 제공. ✍️
  • 25만 페이지 분량의 연구 논문, 금융 문서, 법률 문서 등으로 구성된 데이터 세트로 미세 조정됨. 📚
  • 작은 모델 크기로 휴대폰에서도 실행 가능하며, 온프레미스 환경에서 데이터 유출 없이 사용 가능. 📱
  • Mistral OCR과 비교했을 때, 특정 작업에서 더 나은 성능을 보임. 🏆
  • 향후 더 작은 모델에서도 고성능 OCR 시스템이 등장할 가능성이 높음. 🔮

Recommanded Videos