- 데이터 전처리를 위해
cleansing.py
파일을 생성하고 필요한 pandas와 json 패키지를 import합니다. 📁 - json.load() 함수와 open() 함수를 사용하여 JSON 파일을 불러와 파싱합니다. 🔑
- pandas DataFrame으로 변환 후, 컬럼 헤더를 설정하고, 비어있는 행을 제거합니다. 🐼
- iloc 연산자를 사용하여 불필요한 '토론실' 열을 삭제합니다. ✂️
- 스플릿 함수와 조인 함수를 활용하여 데이터 내 불필요한 공백을 제거하는 함수를 정의하고 적용합니다. 🧹
- to_csv() 함수를 사용하여 정제된 데이터를 CSV 파일로 저장하고, index를 제거합니다. ✅
- 책을 참고하여 코드 모듈화를 진행, 학습 내용을 체계화하는 것을 권장합니다. 📚