- 딥시크 R1 모델은 강력하지만 로컬 환경에서 사용 가능한 증류 모델과는 성능 차이가 큼. 🤯
- 딥시크 증류 모델은 다국어 혼용 문제를 보이며, 추론 과정과 답변 생성 과정에서 일관성 없는 언어 사용이 발생. 🗣️
- 딥시크의 추론 능력과 사원의 한글 생성 능력을 결합하여 한글 추론 파이프라인 구축 가능. 🤝
- 랭그래프를 사용하여 노드와 엣지로 구성된 그래프 형태의 추론 과정을 설계하고 실행. ⚙️
- 딥시크 모델이 생성하는 토큰을 특정 시점에서 멈추게 하여 추론 영역만 활용하고, 사원 모델이 답변을 생성하도록 유도. 🛑