DeepSeek R1 0528 in 6 Minutes
- DeepSeek R1 0528은 공식 발표나 모델 카드 없이 출시되었지만, MIT 라이선스로 자유로운 사용 및 활용이 가능합니다. 🤫
- Live Codebench에서 GPT-3.5 Mini (high)와 GPT-4 Mini (medium) 사이에 위치하며, 오픈소스 모델 중 Qwen과 함께 최상위권 성능을 보입니다. 📊
- Adar Polyglot 벤치마크에서 Claude Opus와 동일한 70.7점을 기록하며 이전 R1 모델(56.9점) 대비 크게 향상되었습니다. 🚀
- 오픈소스 모델로서 호스팅 경쟁이 치열해 매우 저렴한 비용으로 이용 가능하며, Gemini 2.5 Flash Reasoning과 GPT-4 Mini High 사이의 가격 경쟁력을 갖췄습니다. 💰
- OpenRouter를 통해 API 및 채팅 인터페이스로 접근 가능하며, chat.deepseek.com에서도 사용 가능하고 OpenRouter에는 무료 엔드포인트도 제공됩니다. 🌐
- 랜딩 페이지 생성 시 CSS를 직접 작성하는 등 UI 개발에 능숙함을 보였으나, 일부 미세한 개선점이 있습니다. 🎨
- DeepSeek 앱에서 작업 수행 전 '사고 추적(thinking trace)'을 통해 작업 분해 과정을 보여주는 기능이 있습니다. 🤔
- 육각형 안에서 공이 튀는 물리 시뮬레이션에서는 다른 모델보다 성능이 떨어지는 모습을 보였습니다. 📉
- Extended New York Times Connection 벤치마크에서 38.6에서 49.8로 점프하며 Claude Opus에 근접하고 Gemini 2.5 Pro를 능가하는 성능을 보여줍니다. 📰
데브허브 | DEVHUB | DeepSeek R1 0528 in 6 Minutes