- 데이터 전처리는 머신러닝 모델의 정확도를 높이는 데 중요합니다. ⚙️
- 넘파이의
column_stack
함수는 리스트나 배열을 열 방향으로 합쳐 2차원 배열을 만듭니다. 🧱 train_test_split
함수는 데이터를 훈련 세트와 테스트 세트로 나누는 데 유용하며,stratify
매개변수는 클래스 비율을 유지합니다. ➗- K-최근접 이웃 알고리즘은 특성 스케일에 민감하므로, 데이터 표준화가 필요합니다. 📏
- 훈련 데이터의 평균과 표준편차를 사용하여 테스트 데이터도 변환해야 합니다. 🔁