- 딥러닝 전처리 시 pathlib 모듈을 사용하면 파일 경로 관리가 간편해지고 코드 가독성이 향상됩니다. 🗂️
Path()를 사용하여 파일 또는 폴더 경로를 객체로 표현하고, rglob() 함수로 특정 경로 내 모든 파일을 재귀적으로 탐색할 수 있습니다. 🔍
- 파일 확장자 필터링을 위해
suffix 속성을 활용하여 원하는 파일 형식만 선택적으로 처리할 수 있습니다. 🖼️
- 파일명과 폴더 경로는 각각
name과 parent 속성을 통해 쉽게 접근할 수 있습니다. 🏷️
- 전처리 결과를 저장할 폴더가 없을 경우
mkdir() 함수를 사용하여 폴더를 생성하고, exist_ok=True 옵션으로 폴더가 이미 존재할 때 에러를 방지할 수 있습니다. 📁
exists() 함수를 사용하여 파일 존재 여부를 확인하고, 중복 처리를 방지하여 시간을 절약할 수 있습니다. ⏳
unlink() 함수를 사용하여 파일을 삭제할 수 있습니다. 🗑️
- 다음 영상에서는
concurrent.futures를 활용한 multiprocessing, multithread를 통해 전처리 속도를 향상시키는 방법을 소개할 예정입니다. 🚀