- DeepSeekR1 모델과 다양한 크기의 증류 모델 공개 🎉
- MIT 라이선스로 모델 가중치와 코드 공개, 재사용 및 추가 학습 가능 🤝
- 기존 모델(GPT-4, Claude 3.5, LLaMA 등) 대비 우수한 성능 입증 🥇
- 15억 파라미터의 소형 증류 모델도 경쟁력 있는 성능 발휘 😲
- DeepSeek V3 기반의 멀티-스테이지 학습 방식 채택으로 성능 향상 ⚙️
- DeepSeek Chat 인터페이스를 통한 모델 성능 직접 확인 가능 💻
- 모델의 추론 과정을 보여주는 상세한 답변 제공으로 신뢰도 향상 👀