- Gemini 2.5 기반 TTS 모델이 공개되었으며, 단일 및 다중 화자 오디오 생성이 가능하다. 🗣️
- 텍스트를 음성으로 변환할 때 감정이나 스타일을 프롬프트로 지정할 수 있다. 🎭
- AI Studio UI를 통해 다양한 음색을 미리 들어보고 선택할 수 있다. 🎧
- Gemini API를 사용하여 코드에서 TTS를 제어할 수 있으며, Colab 환경에서 사용하기 용이하다. 💻
- 다중 화자 기능은 팟캐스트 제작에 유용하며, 대화 스타일을 지정하여 더욱 생생한 표현이 가능하다. 🎙️
- 음성 효과 및 스타일 지정에 대한 실험을 장려하며, 사용자 피드백을 기다리고 있다. 🧪
- 가격 정보는 아직 미정이며, 클라우드 기반이므로 실시간 사용에는 제약이 있을 수 있다. ☁️