인프런 - 강의/청와대 청원 데이터 시각화 13

12 - wordcloud 그림그리기

일단 conda install -c conda-forge wordcloud 로 설치하시고 import matplotlib.pyplot as plt from wordcloud import WordCloud text = open('us.txt').read() wordcloud = WordCloud().generate(text) plt.figure(figsize=(12,12)) plt.imshow(wordcloud, interpolation = "bilinear") plt.axis("off") plt.show() --참조 https://amueller.github.io/word_cloud/auto_examples/masked.html#sphx-glr-auto-examples-masked-py https://p..

11 - Data 시각화하기

# Package 넣어줌 import numpy as np import matplotlib.pyplot as plt # 값 입력 label = ['A', 'B', 'C', 'S'] index = np.arange(len(label)) plt.bar(index, [10,5,20,10]) # 그리기 plt.title('My title') plt.xlabel('X-title') plt.ylabel('Y-title') plt.xticks(index, label) plt.show() list_data = [('코로나', 29), ('재인', 18), ('대통령', 18), ('신천지', 18), ('문재인', 16), ('마스크', 16), ('탄핵', 15), ('청원', 14), ('코로나19', 13), (..

10 - 실제 데이터 가공하기

# 엑셀을 읽기 위한 준비과정들 from openpyxl import load_workbook read_wb = load_workbook("./blusehouse.xlsx") read_ws = read_wb.active list_excel = [] for i in range(1,151) : print(read_ws.cell(i,1).value.strip()) list_excel.append(str(read_ws.cell(i,1).value.strip())) print(list_excel) from konlpy.tag import Kkma import collections kkma = Kkma() list_temp = [] for row in list_excel : list_temp = kkma.nouns..

9 - 텍스트 가공하기

from konlpy.tag import Kkma import collections kkma = Kkma() list_sentence = ["저는 여자친구가 있습니다", "저는 남자친구가 있습니다", "아버지가 방에 들어가신다", "아버지가방에 들어가신다", "인생은 뭘까요", "돈 많은 백수가 되고싶다", "건물주가 되고싶다", "일더하기 일은 귀요미", "이더하기 이는 귀요미", "삼더하기 삼은 귀요미 귀요미"] for i in list_sentence : print(i) list_a = [] for i in list_sentence : list_a = list_a + kkma.nouns(i) print(list_a) list_a collections.Counter(list_a).most_common..

8 - 단어 숫자 세기

import collections print (collections.Counter(['가', '나', '다', '라', '가', '가'])) print (collections.Counter(['가', '나', '다', '라', '가', '가','가','가자','다'])) for k, v in collections.Counter(['가', '나', '다', '라', '가', '가','가','가자','다']).items() : print(k, v) list_a = ['가', '나', '다', '라', '가', '가','사'] list_b = ['가', '나', '다', '라', '가', '가'] list_c = list_a + list_b print(list_c) collections.Counter(list..

7 - 자연어 처리 라이브러리 konlpy 설치하기

일단 설치부터 합니다. conda install -c conda-forge jpype1 얘를 먼저 설치하고 난 다음 pip install konlpy로 설치합니다. 그러면 이제 사용이 가능합니다. 사용법은 여기 아래에 사이트에 나와있는데 https://konlpy-ko.readthedocs.io/ko/v0.4.3/ from konlpy.tag import Kkma kkma = Kkma() print(kkma.sentences(u'네, 안녕하세요. 반갑습니다.')) # ['네, 안녕하세요.', '반갑습니다.'] print(kkma.nouns(u'질문이나 건의사항은 깃헙 이슈 트래커에 남겨주세요.')) # ['질문', '건의', '건의사항', '사항', '깃헙', '이슈', '트래커'] print(kkma...

5 - 데이터 엑셀에 저장해놓기

from bs4 import BeautifulSoup from selenium import webdriver import time driver = webdriver.Chrome("./chromedriver") result_list = [] for i in range(1,11) : driver.get("https://www1.president.go.kr/petitions/best?page=" + str(i)) soup = BeautifulSoup(driver.page_source, 'html.parser') for i in soup.select("#cont_view > div.cs_area > div > div > div.board.text > div.b_list.category > div.bl_body ..

4 - 국민 청원 페이지 여러개 수집

from bs4 import BeautifulSoup from selenium import webdriver import time driver = webdriver.Chrome("./chromedriver") for i in range(1,11) : driver.get("https://www1.president.go.kr/petitions/best?page=" + str(i)) soup = BeautifulSoup(driver.page_source, 'html.parser') result_list = [] for i in soup.select("#cont_view > div.cs_area > div > div > div.board.text > div.b_list.category > div.bl_body ..