데브허브 | DEVHUB | [머신러닝+딥러닝 기초 강의] 20강. 합성곱 신경망의 구성 요소[머신러닝+딥러닝 기초 강의] 20강. 합성곱 신경망의 구성 요소
- 합성곱 신경망(CNN)은 기존 인공신경망과 구조가 다르며, 특히 컴퓨터 비전 분야에 특화되어 높은 성능을 발휘합니다. 👁️
- 밀집층이 모든 입력 특성에 가중치를 곱하는 반면, 합성곱 연산은 입력 특성의 일부에만 가중치를 곱하고 이를 이동시키며 효율적으로 특징을 감지합니다. 💡
- 합성곱 연산에 사용되는 가중치 집합을 '커널' 또는 '필터'라고 부르며, 필터는 여러 개를 사용하여 입력 이미지의 다양한 특징(예: 색상, 모양, 선)을 감지하도록 훈련됩니다. 🔍
- 합성곱 연산의 결과로 생성되는 2차원 또는 3차원 배열을 '특성 맵(Feature Map)'이라고 하며, 필터의 개수가 특성 맵의 깊이 차원을 결정합니다. 🗺️
- '패딩(Padding)'은 입력 이미지 주위에 가상의 픽셀(주로 0)을 추가하여 합성곱 연산 후 특성 맵의 크기를 조절하거나 입력과 동일하게 유지하는 데 사용됩니다. 🖼️
- '스트라이드(Stride)'는 커널/필터가 입력 위를 이동하는 간격(건너뛰는 크기)을 의미하며, 기본값은 1이지만 값을 늘려 출력 크기를 줄일 수도 있습니다. 🚶
- '풀링(Pooling)'은 특성 맵의 공간적 크기(높이, 너비)를 줄이는 별도의 층으로, 가중치가 없으며 주로 '최대 풀링(Max Pooling)' 또는 '평균 풀링(Average Pooling)' 방식을 사용합니다. 📉
- 일반적인 합성곱 신경망은 합성곱 층, 활성화 함수(ReLU), 풀링 층을 반복적으로 쌓고, 마지막에는 특성 맵을 1차원으로 펼쳐 밀집층에 연결하여 최종 분류를 수행합니다. 🏗️
- 합성곱 신경망은 3차원 입력(높이, 너비, 깊이/채널)을 기대하며, 컬러 이미지는 RGB 3채널, 흑백 이미지는 1채널로 깊이 차원을 명시하여 처리합니다. 🌈