데브허브 | DEVHUB | GPT-5.1 Codex (Fully Tested): This MODEL is ACTUALLY USEFUL! The best ALTERNATIVE to OPUS yet.GPT-5.1 Codex (Fully Tested): This MODEL is ACTUALLY USEFUL! The best ALTERNATIVE to OPUS yet.
- OpenAI는 GPT 5.1, GPT 5.1 Codex 등 새로운 모델 라인업을 출시했으며, GPT 5.1은 'Instant'와 'Thinking' 두 가지 버전으로 지시 이행 능력이 크게 향상되었습니다. 🚀
- 새로운 Codex 모델 중 'Codex Mini'는 성능이 좋지 않지만, 더 큰 'Codex' 모델은 매우 견고하며, 벤치마크는 다소 까다롭습니다. 💻
- 모델 가격은 이전 세대와 동일하며, 응답 API를 통한 캐싱 기능이 24시간으로 개선되어 장기 실행 작업 비용 효율성이 높아졌습니다. 💰
- 개별 테스트 결과, 3JS 포켓볼 구현은 '매우 훌륭'했지만, SVG 팬더, 체스판 자동 재생, Blender 스크립트 등은 제대로 작동하지 않거나 품질이 낮았습니다. 🎨
- GPT 5.1 Codex는 전반적으로 9위를 기록하며 GLM4.6보다 우수하지만 Claude보다는 낮고, Codex Mini는 32위로 매우 저조합니다. 🏆
- 에이전트 작업 테스트에서 Goi 계산기는 훌륭하게 작동했으나, 영화 트래커 앱은 미흡했고, Godo, Open Code Repo, Nux, Rust 앱 등은 오류가 발생하거나 작동하지 않았습니다. 🛠️
- 이 모델은 기존 코드베이스 작업, 계획 및 디버깅에 매우 유용하지만, 모델의 창의성이 필요한 '바이브 코딩'에는 적합하지 않습니다. 💡
- 현재 토큰 생성 속도가 초당 18개로 매우 느려(Sonnet은 80개), 페어 프로그래밍과 같은 빠른 상호작용이 필요한 작업에는 사용하기 어렵습니다. 🐢