- Kyutai는 텍스트 음성 변환(TTS) 및 음성 텍스트 변환(STT) 프로젝트를 공개했습니다. 🗣️
- STT는 현재 영어와 프랑스어만 지원하며, 빠른 속도와 괜찮은 정확도를 보여줍니다. 🇫🇷
- TTS는 다양한 음성 옵션을 제공하며, ElevenLabs와 같은 다른 모델과 비교해도 손색이 없습니다. 🎤
- 음성 복제 모델은 개인 정보 보호 문제로 인해 공개되지 않았지만, 기존 음성을 활용할 수 있습니다. 🔒
- Kyutai는 250만 시간 분량의 데이터로 TTS 모델을 훈련했습니다. 📚
- 기존 음성 임베딩을 혼합하여 새로운 음성을 만들 수 있습니다. 🎛️
- MLX 버전이 나오면 Mac에서도 로컬로 실행할 수 있어 더욱 흥미로울 것입니다. 💻