데브허브 | DEVHUB | [딥러닝 프로젝트] 3강. 사전 훈련된 CNN 모델 | ①이미지 분류 CNN 모델 만들기[딥러닝 프로젝트] 3강. 사전 훈련된 CNN 모델 | ①이미지 분류 CNN 모델 만들기
- 2012년 이미지넷 대회 우승 모델인 알렉스넷은 합성곱 신경망(CNN)의 이미지 분류 분야 성공을 알린 선구자입니다. 🏆
- 알렉스넷은 ReLU 활성화 함수를 최초 도입하여 기울기 소실 문제를 완화하고 깊은 네트워크 훈련을 가능하게 했습니다. 📈
- 평균 풀링 대신 최대 풀링을 사용하여 특징 감지 능력을 효과적으로 유지하는 방식을 채택했습니다. 🏞️
- 과대적합 방지를 위한 드롭아웃 기법을 개발하고 모델 훈련에 도입하여 안정성을 높였습니다. 💡
- 알렉스넷은 227x227x3 입력과 초기 11x11 커널, 큰 스트라이드 등 당시로서는 독특하고 비체계적인 구조를 가졌습니다. 🧩
- 알렉스넷의 사전 훈련된 가중치는 공개되지 않아 직접적인 활용이 어렵습니다. 🚧
- 2013년 이미지넷 대회 준우승 모델인 VGG넷은 옥스포드 대학교 VGG 그룹이 개발했습니다. 🥈
- VGG넷은 단순하고 반복적이며 일관성 있는 구조로, 이후 많은 CNN 모델 설계에 큰 영향을 주었습니다. 🏗️
- 여러 합성곱 층을 쌓은 후 풀링 층을 배치하여 모델을 더 깊게 만들고 용량을 증대시키는 방식을 사용했습니다. 🧱
- 주로 3x3 커널 크기를 사용하여 필터 크기를 표준화하고 모델의 복잡도를 줄였습니다. 📏
- 모델 깊이에 따라 VGG16, VGG19와 같이 버전을 나누는 방식이 이때부터 등장했습니다. 🔢
- VGG넷은 224x224x3 입력을 사용하며, 합성곱 블록(예: 3x3 합성곱 2회 + 최대 풀링)을 반복하는 구조를 가집니다. 🔄
- 반복적인 구조 덕분에 케라스 등으로 구현 시 코드가 매우 간결해지는 장점이 있습니다. 💻
- VGG넷의 사전 훈련된 가중치는 공개되어 있어 유사한 이미지 분류 문제에 전이 학습으로 활용할 수 있습니다. 🌍