처음에 beatifulsoup를 이용해 네이버 인기검색어와, 네이트판 사이트를 크롤링해봤습니다.
위와 같이 몇줄 되지도 않는 코드로 잘 크롤링을 했었구요
그 다음 셀레니움이라는 것을 배워봤습니다.
각각 항목을 찾아 들어가서 click()이라는 것으로 클릭을 해 봤었고
크롤링한 정보가 예쁘게 나오지 않을 경우, 텍스트 가공 법을 배워서 잘 가공하는 것도 연습해봤고
엑셀에 있는 값을 불러오고, 저장하는 것들도 해봤습니다.
이렇게 다양하게 처리할 수 있었습니다.
다만 실전에서 크롤링 할 때는, 저희가 강의에서 다 설명드리지 못한 다양한 경우가 있습니다.
실제로 크롤링을 하실 때 쉽게 안 된다고 포기하지 마시고 검색을 통해서 하나씩 해결해나가면 좋을 것 같습니다.
기회가 된다면 크롤링 심화 강의도 제작해보겠습니다.
감사합니다.
'인프런 - 강의 > 초간단 초스피드 데이터 수집 (파이썬 크롤링)' 카테고리의 다른 글
14 - 실전 크롤링 연습 selenium (0) | 2019.12.23 |
---|---|
13 - 실전 크롤링 beatifulSoup (0) | 2019.12.23 |
12 - 드디어 엑셀로 저장, 불러오기 (2) (0) | 2019.12.23 |
11 - 드디어 엑셀로 저장, 불러오기 (0) | 2019.12.23 |
10 - 간단한 텍스트 가공법 (0) | 2019.12.23 |