인프런 - 강의/초간단 초스피드 데이터 수집 (파이썬 크롤링)

4 - 네이트판 크롤링

----___<<<<< 2019. 12. 20. 14:45

자 이번에는 네이트판 게시글을 크롤링 해보겠습니다.

 

이 주소로 들어가면 https://pann.nate.com/talk/c20002?page=1

 

 

위와 같은 부분의 게시글들을 모두 크롤링 해볼텐데

 

select를 이용해서 경로를 찾으면 아래와 같이 나옵니다.

#searchDiv > div.posting_wrap > table > tbody > tr.first

 

그러면 이제 이 부분을 이용해서 크롤링을 해 봅니다.

 

 

크롤링해보면, 뭔가 예쁘게 나오지 않는데 "a"태그를 찾아서 좀 더 예쁘게 바꿔봤습니다.

 

 

약간 문자열이 이쁘게 나오지 않는데, 저 문자열 가공하는 테크닉들은 뒤에서 다뤄 보도록 하겠습니당