- Nvidia의 새로운 오픈 소스 ASR 모델 Parakeet TDT 출시, 상업적 사용 가능 🚀
- 6억 개의 파라미터를 가진 모델로, 구두점, 대문자, 타임스탬프 기능 지원 ✍️
- Hugging Face Open ASR 리더보드에서 WER(단어 오류율) 기준 1위 차지 🥇
- 고품질 영어 음성 텍스트 변환에 특화, 다양한 억양 인식 능력 우수 🗣️
- 긴 오디오 클립도 텍스트로 변환 가능, 블로그 포스트 등 다양한 활용 기대 💡
잠시만 기다려 주세요.
Recommanded Videos
2025. 4. 28.
2025. 4. 1.
2025. 2. 1.
2024. 2. 13.
2025. 7. 28.
2025. 7. 1.