- GPT-5와 Claude Opus 4.1을 사용하여 AI 코딩 능력을 비교하는 테스트 진행 🧪
- 바구니에 물을 담는 미션을 AI에게 부여하고, 해결 방법 제시 유무에 따른 성공 여부 확인 🚰
- GPT-5는 해결 방법을 제시했을 때 Thinking 모드와 보통 모드 모두 성공 💡
- Claude Opus 4.1은 해결 방법을 제시했음에도 불구하고 세부 요구 사항 미충족으로 실패 😥
- 해결 방법을 제시하지 않았을 때는 GPT-5 Thinking 모드와 보통 모드 모두 실패 😭
- 이전 GPT 모델들은 해결 방법 제시 시 성공했으나, Claude 최신 모델은 실패하는 독특한 결과 🤔
- 테스트 결과가 AI 모델의 전체 성능을 대변하지 않음을 강조하며, 참고 자료로 활용 권장 📢
- 사용된 프롬프트와 테스트 프로그램은 코드 깎는 노인 웹사이트에서 공유 예정 💻