DINO, DINOv2, 딥러닝 자가 지도 학습
- DINO와 DINOv2는 레이블 없는 이미지를 이용한 자기지도학습(Self-Supervised Learning) 기반의 비전 트랜스포머 모델입니다. 🤯
- 두 모델은 Teacher-Student 네트워크 구조를 사용하며, Teacher 네트워크는 Student 네트워크의 EMA(Exponential Moving Average)를 통해 학습됩니다. 🤝
- DINO는 이미지의 CLS 토큰을 사용하지만, 이는 이미지 레이블과 무관한 임의의 벡터 분포를 나타냅니다. 🎲
- DINOv2는 DINO보다 더 많은 데이터와 다양한 자기지도학습 방법을 사용하여 성능을 향상시켰습니다. 🚀
- DINO를 통해 학습된 이미지 인코더는 이미지 분류, 분할, 깊이 추정 등 다양한 컴퓨터 비전 작업에서 우수한 성능을 보입니다. 🏆
- PCA(Principal Component Analysis)를 이용하여 DINO가 추출한 이미지 피처의 분포를 분석하면, 배경 제거 및 유사한 패치 매칭이 가능합니다. 🔬
- DINO와 DINOv2의 가중치는 오픈소스로 공개되어 있어 누구나 사용 가능합니다. 🎁