- 데이터 세트는 결측값, 오류 값, 일관성 없는 데이터로 인해 정리되지 않은 상태였음 🗑️.
- SQL 쿼리를 사용하여 데이터를 정리하고 분석 준비를 마침 ✅.
- 데이터에는 거래 ID, 품목, 수량, 단가, 총 지출, 결제 방법, 위치, 거래 날짜가 포함됨 🧾.
- 열 이름에 공백이 있고 따옴표로 묶여 있어 수정이 필요함 ✍️.
- 데이터에 중복된 행은 없음 👯.
- 품목 열에는 null, unknown, error 값이 존재함 🤔.
- 다른 열에도 error 및 unknown 값이 존재함 ❓.
- 열 이름을 소문자와 밑줄을 사용하여 변경함 ✏️.
- unknown 값을 null 값으로 업데이트함 🔄.
- 데이터 유형을 텍스트에서 숫자 또는 날짜로 변경하여 쿼리 효율성을 높임 🔢.
- 총 지출, 수량, 단가 간의 관계를 이용하여 결측값을 채움 ➕.