- GPT-5, Mini, Nano 모델들이 벤치마크 테스트에서 매우 실망스러운 결과를 보임. 😞
- GPT-5는 10개의 질문 중 단 하나의 수수께끼만 맞춤. ❓
- 코드 생성 및 렌더링 능력도 매우 낮음. 📉
- 모델의 출력 포맷팅 문제: 코드 블록을 제대로 생성하지 못함. ✍️
- 이미지 생성 능력도 기대에 미치지 못함 (예: 판다 SVG). 🐼
- 합성 데이터로 학습된 모델의 한계점을 지적. 🤖
- Anthropic과 Gemini 모델에 대한 긍정적인 평가가 높아짐. 👍
- GPT-5 모델에 대한 전반적인 실망감과 사용 의향 없음. 🚫