- OpenAI의 O3 모델이 Arc AGI 벤치마크에서 놀라울 정도로 우수한 성능을 보여주었는데, 이전 Frontier 모델들은 30% 미만의 점수만 받았었습니다. 🤯
- O3 모델은 다양한 다른 벤치마크에서도 뛰어난 성능을 보여주었습니다. 🚀
- O3 모델은 저렴한 계산 비용으로도 특정 벤치마크에서 높은 점수를 얻을 수 있지만, 지금은 일반 사용자에게는 제공되지 않습니다. 😩
- Arc AGI 벤치마크 문제를 해결하기 위한 계산 비용이 $1.6백만에 달했습니다. 😱