- 온라인 쇼핑몰 데이터 분석을 위해 주문 번호(invoice number), 고객 ID(customer ID) 등의 변수를 활용하여 유효한 데이터를 추출하였다. 📊
- 이산형 변수(discrete variable)인 ‘주문 번호’ 중 'C'가 있는 경우는 주문 취소와 관련된 값으로 판단하여 제외하였다. 🗑️
- 긍정적인 값만 포함해야 하는 'TT' 변수(수량 판단) 에서 음수 값을 가진 건으로 'C'가 없는 경우는 데이터 오류 가능성이 있으며, domain expert와 상의하여 해결 방안을 모색해야 한다. 🤯
- 일관된 가격(Uniform price)의 음수 값 또한 상황에 따라 데이터 오류로 판단하여 제외함이 필요하다. 🚫