- Kimi K2는 "Open Agentic Intelligence"를 지향하며, 에이전트 워크플로우 개선에 집중했습니다. 🤖
- MuonClip이라는 새로운 옵티마이저를 도입하여 학습 안정성을 높였습니다. 🚀
- 데이터셋 품질 향상을 위해 LLM을 활용한 데이터 재구성(rephrasing) 파이프라인을 구축했습니다. ✍️
- 15.5조 토큰 규모의 고품질 데이터셋을 사용하여 사전 학습을 진행했습니다. 📚
- DeepSeek V3의 모델 아키텍처를 거의 그대로 복사했습니다. 🏗️