유튜브블로그Top 10
내 프로필

데브허브 안내
소개업데이트 소식

데브허브 커뮤니티

Chandra OCR in 9 mins!

1littlecoder

2025. 11. 1.

0

#ai
  • Chandra OCR은 DeepSeek OCR보다 뛰어난 성능을 보이는 Data Lab의 새로운 모델입니다. 🚀
  • 이 모델은 마크다운, HTML, JSON 형식으로 출력이 가능하며, 이미지와 PDF에서 텍스트를 매우 정확하게 추출하고 레이아웃 정보를 보존합니다. 📄
  • 특히, 불분명한 필기체, 복잡한 수학 방정식, 표, 그리고 복잡한 레이아웃 처리에서 탁월한 성능을 보입니다. ✍️
  • 다른 OCR 모델들이 어려워하는 이미지 분리 추출 기능을 완벽하게 지원하여, 문서 디지털화 시 이미지 손상 문제를 해결합니다. 🖼️
  • 영어 외에도 힌디어, 일본어 등 40개 이상의 다양한 언어를 지원하여 광범위한 활용이 가능합니다. 🌐
  • 유명한 라마누잔의 필기 편지 데모에서 DeepSeek OCR이 수학 방정식을 제대로 인식하지 못한 반면, Chandra는 훨씬 정확하게 해석했습니다. ➕
  • Olo OCR 벤치마크에서 Chandra는 83.1점을 기록하여 DeepSeek(75점), 유료 MR OCR(72점), Gemini Flash 2, GPT-4o 등 다른 주요 모델들을 능가하는 최고 성능을 입증했습니다. 🏆
  • 90억 매개변수 모델임에도 불구하고 뛰어난 성능을 자랑하며, 대량 문서 OCR, 문서 디지털화, 구조화된 문서 변환, LLM 친화적인 출력에 매우 유용합니다. 💡
  • 라이선스는 Open Rail로 상업적 사용이 가능하지만, 사용 전 Data Lab 팀과 확인하는 것이 좋습니다. ⚖️

Recommanded Videos