Kanana LLM 1.5 개발기

간단 소개

카카오 Kanana LLM 1.5 개발 과정과 Agentic AI를 위한 성능 강화, Context Length 확장, 사용성 개선에 대한 분석.

AI Summary

Kanana LLM 1.5 개발기는 Agentic AI를 위한 LLM 성능 강화에 초점을 맞췄습니다.

Base 성능 개선: 고품질 수학, 코드 데이터 구축 및 2단계 학습을 통해 수학, 코딩 능력을 향상시켰습니다. 어텐션 헤드 수를 유지하며 경량 모델 Kanana Nano를 개선했습니다.
Context Length 확장: NIAH, HELMET 벤치마크를 사용하여 Long Context 이해 능력을 측정하고, Position embedding 조정 및 데이터 재사용을 통해 Context length를 확장했습니다. Base frequency 값을 조정하여 성능을 향상시켰습니다.
Post-training: 사용성 개선: On-policy 강화학습법(PPO) 도입, Generative reward model 도입, Verifiable reward function 결합을 통해 모델의 사용성을 강화했습니다. 답변의 간결성을 높이고, 수학 및 function calling 성능을 개선했습니다.