카
카카오
May 23, 20251회
Kanana LLM 1.5 개발기

간단 소개
카카오 Kanana LLM 1.5 개발 과정과 Agentic AI를 위한 성능 강화, Context Length 확장, 사용성 개선에 대한 분석.
AI Summary
Kanana LLM 1.5 개발기는 Agentic AI를 위한 LLM 성능 강화에 초점을 맞췄습니다.
- Base 성능 개선: 고품질 수학, 코드 데이터 구축 및 2단계 학습을 통해 수학, 코딩 능력을 향상시켰습니다. 어텐션 헤드 수를 유지하며 경량 모델 Kanana Nano를 개선했습니다.
- Context Length 확장: NIAH, HELMET 벤치마크를 사용하여 Long Context 이해 능력을 측정하고, Position embedding 조정 및 데이터 재사용을 통해 Context length를 확장했습니다. Base frequency 값을 조정하여 성능을 향상시켰습니다.
- Post-training: 사용성 개선: On-policy 강화학습법(PPO) 도입, Generative reward model 도입, Verifiable reward function 결합을 통해 모델의 사용성을 강화했습니다. 답변의 간결성을 높이고, 수학 및 function calling 성능을 개선했습니다.
Next Feeds

Strands Agents와 오픈 소스 AI 에이전트 SDK 살펴보기
Strands Agents는 모델 중심 접근 방식으로 AI 에이전트 구축을 간소화하는 오픈 소스 SDK이며, 다양한 모델과 도구를 지원하고 유연한 배포 옵션을 제공합니다.
Strands AgentsAI 에이전트오픈 소스 SDK모델 중심Amazon Bedrock
2025. 5. 22.
AWS

이젠 AI도 하이브리드 시대 - 카카오T On-Device AI 개발기
카카오모빌리티의 On-Device AI 및 하이브리드 AI 개발 경험 공유: Android, iOS 구현 및 클라우드 연동 전략, 실제 서비스 적용 사례 포함.
On-Device AIGemini NanoCore ML하이브리드 AI카카오T 퀵
2025. 5. 22.
카카오모빌리티

코드 리뷰할 시간이 어딨어요? 모닥불 | EP.12
토스 프론트엔드 챕터의 코드 리뷰 문화 활성화 전략과 실전 팁을 소개합니다. 고맥락 리뷰, 코드 스멜 워킹그룹, 코드 리뷰 배틀 등을 통해 코드 품질을 향상시키는 방법을 알아봅니다.
코드 리뷰프론트엔드토스고맥락 리뷰코드 스멜
2025. 5. 22.
토스

오늘은 누구의 손을 들어줘야 할까?
SSG 가격최적화 프로덕트에서 MAB 알고리즘의 한계를 극복하고 Regret 기반의 새로운 가격 결정 방식을 도입한 과정과 그 효과를 분석합니다.
Dynamic PricingMABRegret가격최적화톰슨 샘플링
2025. 5. 22.
SSG

AWS Instance Scheduler로 공휴일에 유휴 자원 관리하기
AWS Instance Scheduler를 확장하여 공휴일 자동 관리를 구현, 운영 효율성을 높이고 비용을 절감하는 서버리스 솔루션을 제시합니다.
AWS Instance Scheduler공휴일 자동 관리공공데이터포털서버리스비용 최적화
2025. 5. 22.
AWS

코드 품질 개선 기법 12편: 세트 할인
상태 업데이트 시점이나 값의 조합을 제한하는 인터페이스를 제공하여 코드 품질을 향상시키는 방법에 대해 설명합니다.
코드 품질세트 할인리팩토링상태 관리인터페이스
2025. 5. 22.
LY Corp