- 파이썬 라이브러리 'Scikit-learn'을 이용하여 고객을 군집화하기 위한 K-means 알고리즘을 배우는 콘텐츠 🤓
- K-means 알고리즘은 'k'개의 클러스터로 데이터를 분할하는 알고리즘으로, 각 클러스터의 중심점인 'centroid'를 찾는 방식으로 작동 🧲
- 'Inertia'는 클러스터링의 성능을 평가하는 지표로 클러스터 중심점과 데이터 포인트 간의 거리의 합을 나타내는 🗜️
- K-means 알고리즘은 적절한 'k' 값을 선택하는 것이 중요하며, 이는 데이터의 특성과 분석 목적에 따라 달라진다 ✨
- 'Silhouette score'는 클러스터 안쪽 데이터와 외부 데이터 간의 유사성을 반영하여 클러스터링의 적절성을 평가하는 지표 👤