분류 전체보기 1203

EC2 셀레니움 배포

메모해놓습니다. https://dvpzeekke.tistory.com/1 위의 블로그에서 가져온 글입니다. chrome 설치하기 이제 chrome 브라우저를 설치해보겠습니다. $ wget -q -O - https://dl-ssl.google.com/linux/linux_signing_key.pub | sudo apt-key add - $ sudo sh -c 'echo "deb [arch=amd64] http://dl.google.com/linux/chrome/deb/ stable main" >> /etc/apt/sources.list.d/google.list' $ sudo apt-get update $ sudo apt-get install google-chrome-stable chromedriver 설치..

개발/잡다개발 2020.07.09

Python 크롤링 user-agent

개복치개발자 강의는 아래의 링크에서 확인할 수 있습니다. 개복치개발자 | Linktree uyalae@naver.com linktr.ee 가끔 beautifulSoup로 크롤링을 할 때 크롤링이 막히는 경우가 종종 있습니다. 그 때 사이트에서 user-agent정보를 확인해서, 이 정보가 없는 경우 막는 방법으로 크롤링을 차단하는데 크롬에서 network -> Headers에 있는 user-agent 정보입니다. 저 정보를 아래의 사이트에서 받아올 수 있습니다. http://www.useragentstring.com/pages/useragentstring.php UserAgentString.com - List of User Agent Strings www.useragentstring.com 아래와 같이 ..

개발/잡다개발 2020.07.01

Selenium Wait

from selenium.webdriver.common.by import By from selenium.webdriver.support.wait import WebDriverWait from selenium.webdriver.support import expected_conditions as EC try : WebDriverWait(driver, 10).until( EC.presence_of_element_located((By.XPATH, 'id 넣기')) ) driver.find_element_by_xpath('id 넣기').click() except : print("error") Selenium 로딩이 완료될 때 까지 기다리는 코드입니다. WebDriverWait에서 driver가 10초동안 기다리면..

개발/잡다개발 2020.06.30

selenium scroll down

driver = webdriver.Chrome("./chromedriver") driver.get('크롤링 할 웹 사이트') # 스크롤 끝까지 내리기 driver.execute_script("window.scrollTo(0, document.body.scrollHeight);") # 스크롤 1000만큼 내리기 driver.execute_script("window.scrollTo(0, 1000);") # 현재 상태에서 200만큼 쭉쭉 4번 내리기 driver.execute_script("window.scrollTo(0, window.scrollY + 200);") driver.execute_script("window.scrollTo(0, window.scrollY + 200);") driver.execut..

개발/잡다개발 2020.06.30