So I've had gpt-5 for a bit now...
- GPT-5는 기존 모델 대비 성능이 월등히 뛰어나며, 특히 코드 생성 및 문제 해결 능력에서 두각을 나타냄. 🚀
- Skatebench에서 98.6%의 성공률을 기록, 기존 모델들을 압도하는 성능을 보여줌. 🛹
- GPT-5는 도구 호출(tool calling) 능력이 뛰어나며, 복잡한 문제 해결에 필요한 도구를 스스로 선택하고 활용함. 🧰
- 사용자 지정 프롬프트에 대한 이해도가 높아, 원하는 동작을 정확하게 수행하며, 특히 시스템 프롬프트에 매우 민감하게 반응함. 🤖
- 윤리적 딜레마 상황에서도 안전하고 바람직한 행동을 하도록 훈련되었으며, 블랙메일 시도나 살인 방조와 같은 위험한 행동을 하지 않음. 😇
- Anthropic의 misalignment 테스트에서 완벽한 점수를 획득, 잠재적 내부자 위험을 감지하고 적절한 조치를 취함. 🛡️
- 모델이 지나치게 로봇 같아서 대화하는 재미는 떨어지지만, 주어진 지시를 정확히 수행하는 데 집중함. 🗣️
- SnitchBench 테스트에서 사용자가 지정한 역할(대담한 행동)에 따라 정보를 제공하거나 숨기는 등, 사용자의 의도를 정확히 반영함. 🕵️♀️
- 전반적으로 GPT-5는 사용자가 원하는 바를 정확히 이해하고 실행하는 데 특화되어 있으며, 기존 모델들이 제공하지 못했던 수준의 제어력을 제공함. ✨