시계열 데이터가 뭔지부터 알아보겠습니다.
영어로 하면 시계열(time series)인데, 시간 상태에 따라, 변화되는 데이터입니다.
그러니깐 시간에 따라 변화되는 데이터입니다.
예를 들면 아래와 같이 생긴애겠죠?
시계열 데이터를 통해
추세 - Trend
계절성 - Seasonality
랜덤 - Random (노이즈 - Noise)
데이터를 분석합니다.
추세는 데이터가 어떻게 되고 있는지
계절성은, 기간마다 어떠 패턴을 가지고 있는지
랜덤은 전혀 관계없이 뜬금없는 데이터인데, 데이터 전처리를 해줘서 이런걸 제거해줘야 합니다.
참조
'개발 > Kaggle' 카테고리의 다른 글
Rossmann Store Sales - 2 (0) | 2020.03.31 |
---|---|
Rossmann Store Sales - 1 (0) | 2020.03.31 |
heatmap (0) | 2020.03.31 |
데이터 시각화 실습 (0) | 2020.03.31 |
fb prophet (0) | 2020.03.25 |