시가총액 분석(6부) - 전체 페이지 자동 수집을 위한 첫걸음! 마지막 페이지 번호 찾기
- Playwright 인스펙터와 개발자 도구를 활용하여 웹 페이지의 특정 요소(예: 테이블 태그)를 추출하는 방법을 설명합니다. 🛠️
- Playwright 인스펙터의 Pick locator 기능은 HTML 문법을 몰라도 태그를 쉽게 추출할 수 있지만, 복잡한 구조에서는 개발자 도구가 더 효과적입니다. 🧐
- 개발자 도구를 사용하면 HTML 구조를 직접 분석해야 하지만, 원하는 부분을 정교하게 추출할 수 있습니다. 💻
- 네이버 페이 증권 웹사이트에서 페이지 이동 버튼을 분석하여 전체 페이지 수를 확인하는 과정을 예시로 보여줍니다. 🏦
- Pick locator를 사용하여 페이지 이동 버튼을 분석하지만, '맨뒤' 버튼의 name 매개변수가 숫자가 아닌 문자열로 출력되어 마지막 페이지 숫자를 확인할 수 없음을 확인합니다. 🔍
- 개발자 도구의 요소 검사 기능을 통해 a 태그의 href 속성에서 페이지 번호 정보를 추출하는 방법을 설명합니다. 🔗
- table 태그의 이름과 summary 속성을 활용하여 페이지 이동 table 태그를 추출하고, 하위 태그(tbody, tr, td, a)를 차례대로 추출합니다. 📚
- nth() 함수 또는 last 속성을 사용하여 특정 요소(예: 마지막 버튼)를 선택하는 방법을 설명합니다. 🔢
- 추출한 href 속성 값에서 split() 함수를 사용하여 페이지 번호를 분리하고, int() 함수를 사용하여 문자열을 정수로 변환합니다. ✂️
- 전체 페이지 수를 추출하는 코드를 작성하고, 웹 브라우저 자동화 코드를 통해 결과를 확인합니다. ✅