Deepseek KILLER but China AGAIN! 💥Ernie 4.5 💥
- 중국 바이두가 새로운 오픈소스 멀티모달 모델 'Ernie 4.5'를 Apache 2.0 라이선스로 출시했습니다. 🚀
- 가장 큰 모델은 DeepSeek V3와 Qwen 3를 능가하는 최고 수준의 성능을 자랑합니다. 🏆
- 텍스트와 이미지를 모두 처리하는 10가지 변형의 대규모 멀티모달 모델입니다. 🖼️
- 효율적인 매개변수 사용을 위한 MoE(Mixture of Experts) 트랜스포머 아키텍처를 채택했습니다. 🧠
- 모달리티 간 매개변수 공유와 전용 매개변수를 동시에 지원하는 혁신적인 이종 모달리티 구조로 멀티모달 이해도를 높였습니다. 💡
- 멀티모달 이종 MoE 사전 학습과 모달리티별 사후 학습이 주요 특징입니다. ✨
- SFT, DPO 외에 UPO(Unified Preference Optimization)를 포함한 고급 사후 학습 기법을 사용합니다. 🛠️
- GPU 자원이 부족한 사용자를 위한 3억 매개변수 소형 모델도 제공하여 접근성을 높였습니다. 🤏
- 모델 훈련, 압축, 미세 조정 등을 지원하는 산업 등급 개발 툴킷 'Ernie Kit'을 함께 출시했습니다. 🧰
- 여러 하드웨어에 쉽게 모델을 배포하고 추론할 수 있는 'Fast Deploy' 솔루션을 제공합니다. ⚡
- 최첨단 오픈소스 모델이 중국에서 지속적으로 나오고 있음을 보여주는 중요한 사례입니다. 🇨🇳
데브허브 | DEVHUB | Deepseek KILLER but China AGAIN! 💥Ernie 4.5 💥