- 배치 정규화의 학습 및 비학습 파라미터: 학습 파라미터는 가중치와 편향이며, 비학습 파라미터는 실행 평균과 실행 분산입니다. 🧠
- 학습과 추론 시 배치 정규화의 차이: 학습 시에는 미니 배치를 사용하여 평균과 분산을 계산하지만, 추론 시에는 학습 데이터셋으로 미리 계산된 평균과 분산을 사용합니다. 🔄
- 배치 정규화의 목적: 공변량 시프트(Covariate Shift) 현상을 완화하여 학습의 안정성을 높입니다. 이는 이전 레이어의 변화로 인해 후속 레이어의 입력 분포가 계속 바뀌는 문제를 해결합니다. 🌊