Qwen-2.5 : The 13 NEW & BEST Opensource LLMs are here! (Qwen-2.5 Language, Coder & Math)
- Qwen-2.5는 3가지 유형(일반 작업, 코드, 수학)의 13개 새로운 오픈소스 LLM을 출시했습니다. 🌠
- 일반 작업 모델은 0.5B부터 72B까지 다양한 크기로 제공되며, 코드 모델은 1.5B와 7B 크기로, 수학 모델은 1.5B, 7B, 72B 크기로 제공합니다. 💡
- 모든 모델은 Apache2.0 라이선스로 오픈 소스이며, Qwen-2.5 Plus와 Turbo는 API를 통해 접근 가능한 폐쇄형 모델입니다. 🔒
- Qwen-2.5는 18조까지 트랙닝된 데이터를 사용하여 학습되었으며, instruction-following, 긴 텍스트 생성, 구조화된 데이터 이해 및 구조화된 출력 생성(특히 JSON) 등에서 향상된 성능을 보여줍니다. 🧠
- Qwen-2.5 32B 모델은 Gemma, GPT-40 mini와 같은 다른 오픈소스 모델과 closed-source 모델들과 비교했을 때 우수한 성능을 보여줍니다. 🏆
- Qwen-2.5 coder 모델은 코드 생성 및 이해 능력이 뛰어나며, CodeStar, DeepSeekV2 Coder 등의 벤치마크에서 우수한 결과를 달성합니다. 💻
- Qwen-2.5 수학 모델은 Chain of Thought를 사용하여 복잡한 수학 문제를 단계별로 추론하고 해결하며, Python 인터프리터를 지원하여 코드를 생성하여 문제를 해결하는 능력을 보여줍니다. 🧮