데브허브 | DEVHUB | VGG From Scratch – Deep Learning Theory & PyTorch Implementation (Full Course)VGG From Scratch – Deep Learning Theory & PyTorch Implementation (Full Course)
- VGG는 컴퓨터 비전 분야에서 매우 영향력 있는 CNN 아키텍처로, 작고 균일한 3x3 필터를 순차적으로 쌓아 강력한 이미지 인식 및 특징 추출을 가능하게 합니다. 🧠
- 핵심 구성 요소는 컨볼루션(특징 감지), ReLU(비선형 관계 학습), 맥스 풀링(차원 축소 및 추상화), 완전 연결 계층(최종 분류)으로 구성됩니다. 🏗️
- VGG의 철학은 '단순성, 깊이, 균일성'이라는 세 가지 기둥 위에 세워졌으며, 체계적으로 확장된 우아한 단순성이 뛰어난 표현력을 발휘할 수 있음을 증명했습니다. ✨
- 설계 원칙은 모든 컨볼루션 계층에 3x3 필터(가장 작은 방향성 정보 캡처 크기)를 사용하고, 스트라이드 1과 패딩 1로 공간 차원을 보존하며, ReLU 활성화 함수를 활용합니다. 📐
- 역사적으로 2014년 ImageNet 챌린지(ILSVRC)에서 상위권을 차지하며, 수작업 특징(SIFT, HOG)에서 딥러닝 기반 특징 학습으로의 전환점을 마련했습니다. 📜
- 아키텍처 변형으로는 VGG16(13개 컨볼루션 + 3개 완전 연결 계층)과 VGG19(16개 컨볼루션 + 3개 완전 연결 계층)가 있습니다. 🔢
- 이 강의는 PyTorch를 사용하여 VGG를 처음부터 재구축하며, Google Colab에서 데이터 처리, 변환, 시각화(torch info, matplotlib, CNN explainer)를 실습합니다. 💻
- 컨볼루션의 수학적 이해는 입력 이미지(X)와 커널/필터(K)의 곱셈 합으로 특징 맵(Y)을 생성하며, 커널의 내용은 역전파 및 경사 하강법을 통해 자동으로 최적화됩니다. ➕
- 특징 학습의 마법은 모델이 가장자리, 각도, 선, 색상 그라데이션 등 다양한 시각적 특징을 스스로 학습하며, 이는 머신러닝의 핵심적인 '스스로 학습하는 능력'을 보여줍니다. 💡
- 입력 이미지는 224x224 크기의 RGB 이미지를 사용하며, 평균 RGB 값을 빼는 전처리 과정을 통해 표준화합니다. 🖼️