데브허브 | DEVHUB | 4 NEW Mistral 3 Models!!
- Mistral의 복귀 및 관련성 재확인: 5개월 만에 새로운 모델을 출시하며, 유럽 시장에만 국한된다는 인식을 불식시키고 오픈소스 AI 분야에서의 지속적인 관련성을 강조했습니다. 🚀
- 4가지 새로운 Mistral 3 모델 출시: Mistral Large 3와 3가지 Ministral 3 모델(14B, 8B, 3B)을 포함한 총 4개의 신규 모델이 공개되었습니다. 🔢
- Mistral Large 3: 강력한 MoE 모델: 675B 파라미터 규모의 Mixture of Experts(MoE) 모델로, 41B의 활성 파라미터를 가지며 최근 다른 MoE 모델들보다 더 많은 활성 파라미터를 사용합니다. 🧠
- Ministral 3: 다양한 크기의 밀집 모델: 14B, 8B, 3B 파라미터의 소형 밀집 모델들이 출시되어, 엣지 디바이스 및 다양한 소규모 애플리케이션에 유용합니다. 📱
- 기반 모델 및 튜닝 모델 동시 제공: 모든 신규 모델에 대해 기반 모델(base model)과 지시 튜닝(instruction-tuned) 버전을 모두 제공하여, 사용자 맞춤형 미세 조정 및 실험을 장려합니다. 🛠️
- 경쟁력 있는 벤치마크 성능: Mistral Large 3는 DeepSeek 3.1 및 Kimi K2와 동등한 수준이며, 오픈 모델 중 최상위권에 속합니다. Ministral 3B는 이전 세대 12B 모델과 견줄 만한 성능을 보입니다. 🏆
- 소형 모델 시장의 중요성 재강조: 다른 기업들이 대형 모델에 집중하는 가운데, Mistral은 다양한 크기의 소형 모델을 지속적으로 출시하여 이 분야의 공백을 메우고 있습니다. 💡
- 사용자 맞춤형 벤치마크의 중요성: 공개 벤치마크보다는 각 기업의 특정 사용 사례에 맞는 자체 벤치마크를 통해 모델을 평가하는 것이 중요하다고 강조합니다. 📊
- 향후 Mistral Large 3 추론 모델 출시 예고: 현재 버전은 비추론 모델이며, 추론 기능이 강화된 Mistral Large 3 모델이 곧 출시될 예정입니다. 🔮
- GGUF 버전 제공으로 접근성 향상: GGUF 버전도 함께 출시되어 사용자들이 쉽게 모델을 다운로드하고 로컬 환경에서 테스트할 수 있습니다. 💻