첫번째 방법과 (class_="")
두번재 방법으로 크롤링(select)
import requests
from bs4 import BeautifulSoup
# 엔터치기
req = requests.get('http://www.naver.com')
# 이런 식으로 HTML에 있는 코드를 다 가져온다
soup = BeautifulSoup(req.text, 'html.parser')
# 첫번째 방법
# for i in soup.find_all("li", class_="ah_item") :
# print(i.find(class_="ah_k").text)
# print("")
# 두번째 방법
# #PM_ID_ct > div.header > div.section_navbar > div.area_hotkeyword.PM_CL_realtimeKeyword_base > div.ah_list.PM_CL_realtimeKeyword_list_base > ul:nth-child(5)
# print(soup.select("#PM_ID_ct > div.header > div.section_navbar > div.area_hotkeyword.PM_CL_realtimeKeyword_base > div.ah_list.PM_CL_realtimeKeyword_list_base > ul > li"))
# naver_list = []
#
# for i in soup.select("#PM_ID_ct > div.header > div.section_navbar > div.area_hotkeyword.PM_CL_realtimeKeyword_base > div.ah_list.PM_CL_realtimeKeyword_list_base > ul > li") :
# naver_list.append(i.find(class_="ah_k").text)
#
# print(naver_list)
'인프런 - 강의 > 초간단 초스피드 데이터 수집 (파이썬 크롤링)' 카테고리의 다른 글
6 - url 링크 찾아내서 크롤링 (0) | 2019.12.20 |
---|---|
5 - 네이트판 여러 페이지 크롤링 (1) | 2019.12.20 |
4 - 네이트판 크롤링 (0) | 2019.12.20 |
2 - 파이참 다운로드, 기본 크롤링 (0) | 2019.12.17 |
1 개요 (0) | 2019.12.17 |