유튜브블로그Top 10
내 프로필

데브허브 안내
소개업데이트 소식

데브허브 커뮤니티

Claude 4.5 Haiku (Fully Tested): The WORST Model Anthropic has ever made! Scores #34 on KingBench

AICodeKing

2025. 10. 16.

0

#ai
#frontend
  • Anthropic의 Claude 4.5 Haiku는 Sonnet 4와 유사한 코딩 성능을 1/3 가격과 2배 빠른 속도로 제공한다고 주장하며 출시되었습니다. 🚀
  • 하지만 실제 테스트 결과, Claude 4.5 Haiku는 Sonnet 4보다 거의 모든 면에서 성능이 떨어지며, 최근 출시된 모델 중 최악으로 평가받았습니다. 📉
  • 바닥 평면도, SVG 이미지 생성, 3JS 포켓볼, 체스판, 웹 마인크래프트 등 다양한 코딩 및 생성 작업에서 비논리적이거나 오류가 많고, 심지어 작동하지 않는 결과물을 내놓았습니다. 🛠️
  • 에이전트 테스트에서도 영화 추적 앱 404 오류, Go 터미널 계산기 오류, Godot 게임 오류 등 심각한 문제점을 보이며, 최악의 AI 코딩 에이전트 중 하나로 지목되었습니다. 🐛
  • 화자는 Anthropic의 Sonnet 3.5가 우연한 성공이었고, 이후 모델들은 개선이 없거나 오히려 퇴보했다고 비판했습니다. 🎲
  • Claude 4.5 Haiku는 OpenAI의 GPT-5 Mini에 해당하는 모델로 포지셔닝되었으나, 실제 성능은 훨씬 뒤떨어지며, 기업용 벤치마크 최적화 모델로 추정됩니다. 🏢
  • 경쟁 모델인 GLM4.6보다 3배 비싸면서도 성능은 200% 가까이 낮아, 비용 효율성이 매우 떨어진다고 지적되었습니다. 💸
  • 화자는 Claude 4.5 Haiku 사용을 강력히 비추천하며, 대신 GLM4.6, GPT-5 Mini, Gro Code Fast와 같은 더 저렴하고 성능 좋은 대안을 권장했습니다. 🚫
  • Anthropic이 투자자들에게 좋은 벤치마크 수치를 보여주기 위해 기업용 모델에 집중하고 있으며, 실제 사용자 경험보다는 기업 가치 부풀리기에 몰두하고 있다고 비판했습니다. 📈

Recommanded Videos