Claude 4.5 Haiku (Fully Tested): The WORST Model Anthropic has ever made! Scores #34 on KingBench

Anthropic의 Claude 4.5 Haiku는 Sonnet 4와 유사한 코딩 성능을 1/3 가격과 2배 빠른 속도로 제공한다고 주장하며 출시되었습니다. 🚀
하지만 실제 테스트 결과, Claude 4.5 Haiku는 Sonnet 4보다 거의 모든 면에서 성능이 떨어지며, 최근 출시된 모델 중 최악으로 평가받았습니다. 📉
바닥 평면도, SVG 이미지 생성, 3JS 포켓볼, 체스판, 웹 마인크래프트 등 다양한 코딩 및 생성 작업에서 비논리적이거나 오류가 많고, 심지어 작동하지 않는 결과물을 내놓았습니다. 🛠️
에이전트 테스트에서도 영화 추적 앱 404 오류, Go 터미널 계산기 오류, Godot 게임 오류 등 심각한 문제점을 보이며, 최악의 AI 코딩 에이전트 중 하나로 지목되었습니다. 🐛
화자는 Anthropic의 Sonnet 3.5가 우연한 성공이었고, 이후 모델들은 개선이 없거나 오히려 퇴보했다고 비판했습니다. 🎲
Claude 4.5 Haiku는 OpenAI의 GPT-5 Mini에 해당하는 모델로 포지셔닝되었으나, 실제 성능은 훨씬 뒤떨어지며, 기업용 벤치마크 최적화 모델로 추정됩니다. 🏢
경쟁 모델인 GLM4.6보다 3배 비싸면서도 성능은 200% 가까이 낮아, 비용 효율성이 매우 떨어진다고 지적되었습니다. 💸
화자는 Claude 4.5 Haiku 사용을 강력히 비추천하며, 대신 GLM4.6, GPT-5 Mini, Gro Code Fast와 같은 더 저렴하고 성능 좋은 대안을 권장했습니다. 🚫
Anthropic이 투자자들에게 좋은 벤치마크 수치를 보여주기 위해 기업용 모델에 집중하고 있으며, 실제 사용자 경험보다는 기업 가치 부풀리기에 몰두하고 있다고 비판했습니다. 📈

로딩 중...

Claude 4.5 Haiku (Fully Tested): The WORST Model Anthropic has ever made! Scores #34 on KingBench

Claude Code 신기능 Subagents | 멀티 에이전트 + Playwright MCP

OpenAI o3 mini FAILED My Test BIG TIME!

Modular Design and Engine Optimization | Build Efficiently in Unreal Engine 5

React 19 Tutorial - 3 - Project Structure

두 권의 책으로 알아보는 효과적인 습관 형성 & 삶의 원칙!

채용과 짝사랑