- Qwen 2.5 VL은 이미지 이해 능력이 뛰어나고, 특히 한글 OCR 기능이 우수함. 🖼️
- Ollama를 통해 Qwen 2.5 VL을 쉽게 사용할 수 있으며, 양자화 모델을 제공하여 저사양 GPU에서도 활용 가능. 🦙
- Qwen 2.5 VL은 이미지 내 객체 위치 판별 및 Bounding Box 생성 가능. 📦
- 한글 관련 환각 현상이 있을 수 있지만, 전반적으로 문서 이해 및 정보 추출 능력이 뛰어남. 🧐
- 이미지 디스크립션을 생성하여 데이터프레임에 저장하고, 이를 벡터 DB와 연동하여 RAG 시스템 구축 가능. 📚