개발/Kaggle 36

Rossmann Store Sales - 1

Rossmann Store Sales 데이터 분석 캐글 대회에 대해 알아봅니다. https://www.kaggle.com/c/rossmann-store-sales Rossmann Store Sales Forecast sales using store, promotion, and competitor data www.kaggle.com 얘가 뭐냐하면, 독일의 약국 체인이랍니다. 얘의 판매량을 예측하는 대회입니다. 일단 데이터를 살펴보면 아래와 같습니다. 얘네들을 가져와서 간단하게 데이터를 살펴보고 시각화해봅니다. 참고 # https://www.kaggle.com/ashishpatel26/rossman-stores-sales-analysis # https://github.com/cosmicudemy/ML_Cas..

개발/Kaggle 2020.03.31

시계열 데이터

시계열 데이터가 뭔지부터 알아보겠습니다. 영어로 하면 시계열(time series)인데, 시간 상태에 따라, 변화되는 데이터입니다. 그러니깐 시간에 따라 변화되는 데이터입니다. 예를 들면 아래와 같이 생긴애겠죠? 시계열 데이터를 통해 추세 - Trend 계절성 - Seasonality 랜덤 - Random (노이즈 - Noise) 데이터를 분석합니다. 추세는 데이터가 어떻게 되고 있는지 계절성은, 기간마다 어떠 패턴을 가지고 있는지 랜덤은 전혀 관계없이 뜬금없는 데이터인데, 데이터 전처리를 해줘서 이런걸 제거해줘야 합니다. 참조 [1] - https://kyounju.tistory.com/25

개발/Kaggle 2020.03.25