- Perplexity사가 DeepSeek R1의 검열되지 않은 버전인 R11 1776을 Hugging Face에 공개! 🎉
- 기존 모델의 크기와 품질을 유지하면서 검열을 해제하는 새로운 기술 사용. 🤫
- 중국 정부 및 관련 논란에 대한 질문에 대해서만 검열 해제에 초점. 🇨🇳
- 300개의 주제를 식별하고, 다국어 검열 분류기를 사용하여 4만 개의 프롬프트 데이터셋을 생성. 📚
- 사실적이고 정확한 답변을 얻기 위해 Chain of Thought 추론을 활용. 🤔
- NVIDIA의 Nemo 2.0 프레임워크를 사용하여 모델을 재훈련. ⚙️
- 다양한 벤치마크에서 원본 DeepSeek R1과 거의 동일한 성능을 유지. 📈
- 중국 검열 수준이 가장 낮은 것으로 평가. 📉
- 향후 소형 모델 및 재훈련 스크립트 공개 가능성. 💡