- OpenAI는 Kaggle 대회 데이터를 기반으로 'MLE' 데이터 세트를 제작했습니다. 🤖
- MLE 데이터 세트는 AI 에이전트가 소프트웨어 엔지니어링 문제를 해결하는 능력을 평가하는 데 사용됩니다. 👨💻
- OpenAI는 75개의 Kaggle 대회에서 플래그십 모델 '01 preview'를 사용하여 평균 17%의 대회에서 동메달 이상 수상했습니다. 🏆
- OpenAI는 'MLE' 데이터 세트와 코드베이스를 공개하여 다른 모델의 성능 평가를 용이하게 했습니다. 🔓
- OpenAI는 단순히 LLMs를 사용하지 않고 오픈 소스 스케폴을 사용하여 AI 에이전트를 강화했습니다. 🧠





