유튜브블로그Top 10
내 프로필

데브허브 안내
소개업데이트 소식

데브허브 커뮤니티

Qwen 3 Embeddings & Rerankers

Sam Witteveen

2025. 6. 6.

0

#ai
#backend
  • Qwen-3에서 새로운 임베딩 및 리랭킹 모델들을 Hugging Face에 공개하여 로컬 환경에서 사용 가능하게 됨. 💾
  • 다양한 크기의 임베딩 모델(6B, 8B)과 GGUF 버전을 제공하여 Lama나 LM Studio에서도 사용 가능할 것으로 예상됨. 🦙
  • 임베딩 모델뿐만 아니라 리랭킹 모델도 함께 제공하여 RAG 시스템 구축에 유용하며, 크기별로 선택 가능. 🧰
  • Apache 2 라이선스로 배포되어 자유로운 사용이 가능하며, 다국어 임베딩에서 최첨단 성능을 보임. 🌐
  • Instruction을 사용하여 임베딩의 목적을 변경할 수 있으며, Matrioska Representation Learning을 통해 임베딩 벡터 크기 조절 가능. 📐
  • 최대 32k의 긴 sequence 길이를 지원하며, 이는 RAG 시스템에서 유용하게 활용될 수 있음. 📚
  • 향후 multimodal 임베딩 모델 개발 계획을 발표하여 이미지 등 다양한 데이터 유형 지원을 예고함. 🖼️
  • RAG 시스템 구축 시 latency가 accuracy만큼 중요하며, Qwen-3 모델은 이러한 균형을 맞출 수 있도록 설계됨. ⚖️

Recommanded Videos