Devin's FIRST Open Source Model Shatters OpenAI O3!
- Devin의 첫 오픈소스 모델인 'Kevin'은 GPU 커널 프로그래머로, 320억 매개변수 모델입니다. 💻
- 이 모델은 OpenAI의 플래그십 모델인 O3를 GPU 커널 프로그래밍 벤치마크에서 능가하는 성능을 보여주었습니다. 🚀
- Kevin은 Qwen 320억 매개변수 모델을 기반으로 혁신적인 미세 조정 기법을 적용하여 개발되었습니다. 🧠
- 모델 훈련에는 '다중 턴 강화 학습(Multi-turn Reinforcement Learning)' 방식이 사용되었으며, 이는 반복적인 피드백 루프를 통해 성능을 향상시켰습니다. 🔄
- '폭발적인 컨텍스트 창(Exploding Context Window)' 문제는 추론 시 사고의 사슬(Chain of Thought)을 요약하는 방식으로 해결되었습니다. ✂️
- 단일 보상 문제(Single Reward Problem)는 '할인된 점수 합계(Discounted Sum of Scores)'라는 새로운 보상 함수를 도입하여 각 개선 단계를 개별 훈련 샘플처럼 처리했습니다. 💰
- KernelBench 벤치마크에서 Kevin은 65%의 점수를 기록하며 O3(35%) 및 O4 mini(36%)를 크게 앞섰습니다. 🏆
- 이 모델은 Hugging Face에 공개되어 있으며, 실행에 많은 컴퓨팅 자원을 필요로 하지 않아 접근성이 높습니다. 🌐
- 흥미로운 발견으로, 사고의 사슬 응답이 'okay'로 시작하지 않으면 '쓰레기(junk)'일 가능성이 높다는 점이 밝혀졌습니다. 🤔
- 화자는 OpenAI의 파트너인 Devin이 OpenAI의 플래그십 모델을 능가하는 오픈소스 모델을 출시한 것에 놀라움을 표했습니다. 😲
- 훈련 데이터셋과 평가 데이터셋이 동일한 벤치마크에서 파생된 점에 대해 논란의 여지가 있지만, 이는 일반적인 머신러닝 관행으로 설명되었습니다. ⚖️
데브허브 | DEVHUB | Devin's FIRST Open Source Model Shatters OpenAI O3!