Qwen 3 Embeddings & Rerankers
- Qwen-3에서 새로운 임베딩 및 리랭킹 모델들을 Hugging Face에 공개하여 로컬 환경에서 사용 가능하게 됨. 💾
- 다양한 크기의 임베딩 모델(6B, 8B)과 GGUF 버전을 제공하여 Lama나 LM Studio에서도 사용 가능할 것으로 예상됨. 🦙
- 임베딩 모델뿐만 아니라 리랭킹 모델도 함께 제공하여 RAG 시스템 구축에 유용하며, 크기별로 선택 가능. 🧰
- Apache 2 라이선스로 배포되어 자유로운 사용이 가능하며, 다국어 임베딩에서 최첨단 성능을 보임. 🌐
- Instruction을 사용하여 임베딩의 목적을 변경할 수 있으며, Matrioska Representation Learning을 통해 임베딩 벡터 크기 조절 가능. 📐
- 최대 32k의 긴 sequence 길이를 지원하며, 이는 RAG 시스템에서 유용하게 활용될 수 있음. 📚
- 향후 multimodal 임베딩 모델 개발 계획을 발표하여 이미지 등 다양한 데이터 유형 지원을 예고함. 🖼️
- RAG 시스템 구축 시 latency가 accuracy만큼 중요하며, Qwen-3 모델은 이러한 균형을 맞출 수 있도록 설계됨. ⚖️