자 이번에는 네이트판 게시글을 크롤링 해보겠습니다.
이 주소로 들어가면 https://pann.nate.com/talk/c20002?page=1
위와 같은 부분의 게시글들을 모두 크롤링 해볼텐데
select를 이용해서 경로를 찾으면 아래와 같이 나옵니다.
#searchDiv > div.posting_wrap > table > tbody > tr.first
그러면 이제 이 부분을 이용해서 크롤링을 해 봅니다.
크롤링해보면, 뭔가 예쁘게 나오지 않는데 "a"태그를 찾아서 좀 더 예쁘게 바꿔봤습니다.
약간 문자열이 이쁘게 나오지 않는데, 저 문자열 가공하는 테크닉들은 뒤에서 다뤄 보도록 하겠습니당
'인프런 - 강의 > 초간단 초스피드 데이터 수집 (파이썬 크롤링)' 카테고리의 다른 글
6 - url 링크 찾아내서 크롤링 (0) | 2019.12.20 |
---|---|
5 - 네이트판 여러 페이지 크롤링 (1) | 2019.12.20 |
3 - 네이버 인기검색어 크롤링 (0) | 2019.12.17 |
2 - 파이참 다운로드, 기본 크롤링 (0) | 2019.12.17 |
1 개요 (0) | 2019.12.17 |