- 쿼리 라우팅을 통해 LLM 앙상블의 효율성을 높이는 방법 제시 🚀
- 리워드 모델을 활용, LLM의 전문성을 간접적으로 평가하고 라우팅에 활용 🧠
- 태그 기반 레이블 스무딩으로 리워드 모델의 불확실성을 완화, 학습 안정화 🛡️
- 다양한 벤치마크에서 기존 방식 대비 우수한 성능과 효율성 입증 🎉
- 리워드 모델 품질에 따른 성능 변동 가능성이 존재 ⚠️
Recommanded Videos
2025. 5. 17.
2025. 4. 2.
2025. 4. 8.
2025. 8. 30.
2024. 9. 29.
2024. 9. 6.