from bs4 import BeautifulSoup
from selenium import webdriver
import time
driver = webdriver.Chrome("./chromedriver")
result_list = []
for i in range(1,11) :
driver.get("https://www1.president.go.kr/petitions/best?page=" + str(i))
soup = BeautifulSoup(driver.page_source, 'html.parser')
for i in soup.select("#cont_view > div.cs_area > div > div > div.board.text > div.b_list.category > div.bl_body > ul > li"):
print(i.find("div", class_="bl_subject").text[3:].strip())
result_list.append(i.find("div", class_="bl_subject").text[3:])
time.sleep(5)
driver.close()
# 엑셀부분
from openpyxl import Workbook
write_wb = Workbook()
write_ws = write_wb.active
for i in range(1,len(result_list)+1) :
write_ws.cell(i, 1, result_list[i-1])
write_wb.save('bludhouse.xlsx')
'인프런 - 강의 > 청와대 청원 데이터 시각화' 카테고리의 다른 글
7 - 자연어 처리 라이브러리 konlpy 설치하기 (0) | 2020.03.02 |
---|---|
6 - 데이터 엑셀에서 읽기 (0) | 2020.03.01 |
4 - 국민 청원 페이지 여러개 수집 (0) | 2020.03.01 |
3 - 국민 청원 페이지 데이터 수집 (0) | 2020.03.01 |
2 - 설치하기 (0) | 2020.03.01 |