- 시지온 트랜스포머는 핵심 내용을 완전히 이해해야 하며, 시각 정보를 토큰으로 변환하여 트랜스포머 아키텍처로 처리하는 방식을 기반으로 합니다. 🧐
- 프로젝트에서는 'CIFAR-10' 데이터셋을 사용하며, 각 이미지는 32x32 크기로 구성되어 있으며 10개의 클래스로 분류됩니다. 🖼️
- TinyVisionTransformer는 4x4 크기의 패치로 이미지를 분할하고, 각 패치에 대한 embedding 벡터를 생성합니다. ✂️
- 리니어 프로젝션과 GPU 사용을 통해 효율적인 컴퓨팅과 연산 속도 향상을 추구합니다. 📈
- 본 강의를 학습하기 전에 Transformer를 이해하는 것이 매우 중요하다는 강조입니다. 📚