- 바이트댄스가 틱톡의 모회사로서 70억 개의 파라미터를 가진 비디오 생성 모델 "Seed"를 개발, 이는 작은 모델로 고품질 비디오를 만들려는 시도입니다. 🔬
- Seed 모델은 665,000 H100 GPU 시간을 사용하여 구축되었으며, 효율성을 주요 목표로 삼고 있습니다. ⏱️
- 이 모델은 이미지, 오디오, 키 프레임을 기반으로 비디오를 생성할 수 있으며, 특히 오디오와 비디오를 동시에 생성하는 기능이 돋보입니다. 🎶
- Seed는 720p HD 비디오를 24fps로 생성할 수 있으며, 이는 틱톡 필터 등에 유용할 수 있습니다. 📱
- 모델 아키텍처는 VAE와 DIT(Diffusion Transformer)의 조합을 사용하며, 이는 비디오 생성의 미래 방향을 제시합니다. 💡