- 마이크로소프트의 새로운 Phi-4 모델, 특히 다중 모달 모델 공개🎉
- Phi-4-mini는 38억 파라미터로 기능 호출 기능 추가, 다양한 기기에서 작동 가능🚀
- 5조 토큰으로 훈련, 합성 데이터 활용으로 수학 및 코딩 능력 향상 🧮
- 비전 및 오디오 인코더 통합으로 이미지와 오디오 처리 가능한 진정한 다중 모달 모델 구현 🖼️🔊
- LoRA를 활용하여 비전 및 오디오 인코더 효율적으로 통합, 확장성 확보💡
- 이미지 캡션 생성, OCR, 시각적 질문 응답 등 다양한 작업 수행 가능 🔎
- 오디오 전사 및 번역 기능 제공, 정확도 높음 🗣️➡️📝
- Transformers 라이브러리 지원으로 다중 모달 모델 처리 용이해짐 💻
- 다양한 기기에서 작동 가능한 경량 모델임에도 불구하고 인상적인 성능 제공👏