- Boson AI의 Higs Audio V2 모델은 감정 표현에 뛰어난 TTS 및 음성 복제 기능을 제공합니다. 😮
- 1천만 시간 이상의 오디오 데이터로 사전 훈련되었으며, 미세 조정 없이도 높은 성능을 보입니다. 🤯
- 감정 및 질문 범주에서 GPT4 mini TTS보다 높은 점수를 얻었습니다. 🤔
- 음성 복제 시 화자의 스타일, 억양, 배경 오디오까지 포착할 수 있습니다. 🎧
- Hugging Face에서 데모를 사용해 볼 수 있으며, 상업적 용도로도 사용 가능합니다. 🧑💻