- PCA는 특이값 분해(SVD)의 통계적 버전으로 이해할 수 있다. 🧮
- PCA의 수학적 과정은 평균을 0으로 만드는 과정, 공분산 행렬 계산, 그리고 고유벡터와 고유값을 구하는 과정으로 이루어진다. 🔄
- 공분산 행렬은 변수 간의 상관관계를 나타내는 행렬이며, PCA는 이를 고유벡터(새로운 축)와 고유값(축의 중요도)으로 분해한다. 📊
- 고유값은 각 축의 중요도를 나타내며, 큰 고유값을 가진 축이 더 중요한 정보를 담고 있다. ✨
- 고유벡터는 원래 데이터를 새로운 축(주성분)으로 투영하는 데 사용되며, ψ(사이) 성분은 원래 관측값을 새로운 축으로 변환한 값이다. ➡️