데브허브 | DEVHUB | [파이썬 프로젝트] Ch 07. 시가총액 분석 | ④데이터를 파일로 저장하기[파이썬 프로젝트] Ch 07. 시가총액 분석 | ④데이터를 파일로 저장하기
- 이전 강의에서 작성한 시가총액 데이터 추출 코드를 재활용하고,
tag_header, tag_body, tag_table 변수를 활용하여 코드를 리팩토링하여 가독성을 높였습니다. 🧹
- 테이블의 모든 데이터를 추출하기 위해
Tbody 내의 모든 TR 태그를 locator.all() 함수로 가져오고, 반복문을 통해 각 TR 태그 안의 TD 태그들을 순회하여 텍스트 값을 리스트 형태로 추출했습니다. 🔄
- 추출된 총 50개의 종목 데이터(삼성전자, SK하이닉스 등)가 터미널에 올바르게 출력되는 것을 확인하여 데이터 추출의 유효성을 검증했습니다. ✅
- 추출된 테이블 헤더와 바디 데이터를 딕셔너리 형태로 변환한 후, 파이썬 내장
json 패키지의 dumps() 함수를 사용하여 JSON 형식의 문자열로 변환했습니다. ↔️
open() 함수와 with 문을 사용하여 output 폴더 내 page1.json 파일에 JSON 데이터를 저장했으며, 쓰기 모드('w')와 UTF-8 인코딩을 명시하여 파일 저장 오류를 방지했습니다. 💾
json.dumps() 함수 호출 시 indent 매개변수에 숫자를 입력하여 JSON 파일에 자동으로 들여쓰기를 적용하고, ensure_ascii=False 설정을 통해 한글이 깨지지 않고 올바르게 표시되도록 처리했습니다. ✨