- 테스트 세트는 모델 성능의 최종 확인용으로 단 한 번만 사용해야 함. 🧪
- 검증 세트를 활용하여 하이퍼파라미터 튜닝을 수행하고, 과적합을 방지함. 🧐
- 교차 검증은 데이터셋이 작을 때 모델의 일반화 성능을 높이는 데 유용함. ➗
cross_validate
함수는 K-폴드 교차 검증을 간편하게 수행하도록 지원함. ⚙️- 분류 모델에서는
StratifiedKFold
를 사용하여 클래스 비율을 유지하는 것이 중요함. ⚖️ GridSearchCV
는 지정된 하이퍼파라미터 조합을 모두 시도하여 최적의 모델을 찾음. 🧮RandomizedSearchCV
는 하이퍼파라미터 공간에서 무작위로 샘플링하여 탐색 시간을 단축함. 🎲