- 엔비디아의 새로운 추론 모델 출시: 새로운 Llama Nemotron 모델 공개 🎉
- Llama 3.1 및 3.3 기반의 49B(Llama 3.3 Nemotron Super 49B V1) 및 8B(Llama 3.1 Nemotron Nano) 모델 제공 🤖
- 메타 AI의 Llama 모델을 기반으로, 추론 능력 향상을 위한 추가 학습 진행 📚
- 2천만 개 이상의 샘플을 포함한 사후 학습 데이터셋 공개: 수학, 코드, 과학 등 다양한 분야의 데이터 포함 📊
- 추론 기능을 켜고 끌 수 있는 기능 제공: DeepSeekR1과 유사한 '생각 토큰' 활용💡
- 49B 모델은 우수한 성능을 보이나, 8B 모델은 기대치에 못 미침 🤔
- NVIDIA의 사후 학습 데이터셋은 추론 모델 학습에 유용할 것으로 예상됨 👍