Better Stack Podcast Ep 1: The GPT-5 Backlash, AI CLI Tools & AI Agent Protocols
- Chat GBT5 출시 후 사용자들의 기대와 다른 성능에 대한 반발이 컸으며, 라이브 스트림의 어색함과 잘못된 벤치마크 데이터도 문제였다. 😠
- OpenAI는 Chat GBT5 출시 전 여러 인플루언서에게 모델을 제공하여 홍보를 진행했지만, 실제 사용자 경험은 기대에 미치지 못했다. 😮
- Chat GBT5는 라우터 시스템을 통해 필요에 따라 이전 모델을 선택적으로 사용하는데, 이 과정에서 부적절한 모델 선택이 발생하여 사용자 불만을 야기했다. 😕
- 사용자들은 Chat GBT5의 차가운 응답 방식에 불만을 표하며, 이전 모델인 GPT-4의 따뜻한 느낌을 그리워했다. 😥
- AI 모델에 대한 사용자들의 선호도가 나뉘면서, 특정 모델에 대한 애착이 형성되고 있으며, 이는 마치 Android와 Apple 간의 논쟁과 유사한 양상을 보인다. 🤔
- 코드 작성에 특화된 AI 도구 중 Claude Code가 전반적인 이해도와 성능 면에서 가장 우수하다는 평가를 받고 있다. 👍
- Crush CLI는 시각적으로 매력적이지만, 기능 면에서는 Claude Code나 Open Code에 비해 부족한 부분이 있다. 🎨
- 벤치마크 데이터의 신뢰성에 대한 의문이 제기되고 있으며, 일부 모델이 벤치마크 데이터를 학습에 활용했을 가능성이 있다는 주장이 있다. 🧐
- Anthropic의 Claude 모델은 개발자들의 사고방식을 더 잘 이해하고, 코드 작성 능력도 뛰어나 개발자들 사이에서 인기가 높다. 🤓
- GPT5의 벤치마크 점수는 높지만, 실제 코딩 작업에서는 기대에 미치지 못한다는 의견이 많아 개발자들의 신뢰를 회복하기 위한 노력이 필요하다. 🦾