개발/잡다개발

파이썬 크롤링 도구

----___<<<<< 2020. 5. 27. 14:58

 

크롤링을 하다보면 다양한 라이브러리를 사용합니다.

 

beautifulSoup, Selenium, Scrapy를 주로 사용하는데

 

beautifulSoup

 

장점 - 매우 배우기 쉽습니다.

단점 - 기능에 제한적입니다. 단순하게 웹 페이지의 html을 가져와서 원하는 정보를 뽑아내는 수준입니다.

 

Selenium

 

장점 - 브라우저를 직접 띄워서 사용하기 때문에, 여러 작업을 시킬 수 있습니다.

단점 - 브라우저 직접 띄워서 느립니다.

 

Scrpay

 

장점 - 다양한 플러그인을 통해서 좀 더 효율적인 크롤링 작업을 할 수 있습니다.

단점 - 배우기 어렵습니다.

 

 

개인적으로는

 

beautifulSoup - 크롤링 연습용

Selenium - 가져와야 하는 데이터 양이 적은 서비스

Scrpay - 대용량 데이터 처리

 

정도로 정리할 수 있을 것 같습니다.

 

'개발 > 잡다개발' 카테고리의 다른 글

Readers Writer Problems  (0) 2020.05.30
Scrapy 구조 분석  (0) 2020.05.27
B+ Tree  (0) 2020.05.25
구글 colab import csv read as pandas  (0) 2020.05.24
ARM 프로세서  (0) 2020.05.11