유튜브블로그Top 10
내 프로필

데브허브 안내
소개업데이트 소식

데브허브 커뮤니티

NVIDIA's New Reasoning Models

Sam Witteveen

2025. 3. 19.

0

#ai
#etc
  • 엔비디아의 새로운 추론 모델 출시: 새로운 Llama Nemotron 모델 공개 🎉
  • Llama 3.1 및 3.3 기반의 49B(Llama 3.3 Nemotron Super 49B V1) 및 8B(Llama 3.1 Nemotron Nano) 모델 제공 🤖
  • 메타 AI의 Llama 모델을 기반으로, 추론 능력 향상을 위한 추가 학습 진행 📚
  • 2천만 개 이상의 샘플을 포함한 사후 학습 데이터셋 공개: 수학, 코드, 과학 등 다양한 분야의 데이터 포함 📊
  • 추론 기능을 켜고 끌 수 있는 기능 제공: DeepSeekR1과 유사한 '생각 토큰' 활용💡
  • 49B 모델은 우수한 성능을 보이나, 8B 모델은 기대치에 못 미침 🤔
  • NVIDIA의 사후 학습 데이터셋은 추론 모델 학습에 유용할 것으로 예상됨 👍

Recommanded Videos