- 비디오 데이터를 활용한 RAG(Retrieval-Augmented Generation) 시스템 제안 🎥
- 기존 텍스트 기반 RAG의 한계 극복 및 비디오의 풍부한 정보 활용 강조 🎞️
- 비디오 및 텍스트 정보 동시 처리를 위한 대규모 비디오 언어 모델(LVLMs) 활용 🤖
- 비디오 특징 추출 및 텍스트 정보와의 통합을 위한 효율적인 프레임워크 구축 ⚙️
- WikiHow QA 데이터셋을 활용한 실험 결과, 기존 시스템 대비 성능 향상 확인 💪
잠시만 기다려 주세요.
Recommanded Videos
2025. 5. 30.
2024. 12. 6.
2024. 6. 8.
2024. 12. 4.
2025. 7. 27.
2025. 6. 23.