- Alibaba의 Quen에서 강력한 오픈 소스 코딩 모델 Quen 3 Coder 출시 🚀
- 4800억 파라미터 모델이지만, 실제 활성화되는 파라미터는 350억 개뿐인 MOE 구조 🧠
- 256k 컨텍스트 창 지원, YAN 확장을 통해 100만 토큰까지 확장 가능 🪟
- SWEBench Verified 벤치마크에서 우수한 성능을 보임 (67%, fine tuning 후 69.6%) 🏆
- 7.5조 토큰으로 학습, 70%가 코딩 데이터로 구성 ⌨️
- Quen 2.5 Coder를 활용하여 noisy 데이터를 정제, 데이터 품질 향상 ✨
- Long Horizon RL을 통해 멀티턴 대화 및 도구 사용을 장려 💬
- Alibaba 클라우드 인프라 활용, 2만 개의 독립적인 환경에서 병렬 학습 ☁️
- CLI 도구 제공, 온프레미스 환경 구축 가능성 제시 💻