개발/Kaggle

시계열 데이터

개복치 개발자 2020. 3. 25. 11:13

시계열 데이터가 뭔지부터 알아보겠습니다.

 

영어로 하면 시계열(time series)인데, 시간 상태에 따라, 변화되는 데이터입니다.

 

그러니깐 시간에 따라 변화되는 데이터입니다.

 

예를 들면 아래와 같이 생긴애겠죠?

 

 

시계열 데이터를 통해

 

추세 - Trend

계절성 - Seasonality

랜덤 - Random (노이즈 -  Noise)

 

데이터를 분석합니다.

 

추세는 데이터가 어떻게 되고 있는지

 

계절성은, 기간마다 어떠 패턴을 가지고 있는지

랜덤은 전혀 관계없이 뜬금없는 데이터인데, 데이터 전처리를 해줘서 이런걸 제거해줘야 합니다.

 

 

 

 

 

 

 

참조

[1] - https://kyounju.tistory.com/25

'개발 > Kaggle' 카테고리의 다른 글

Rossmann Store Sales - 2  (0) 2020.03.31
Rossmann Store Sales - 1  (0) 2020.03.31
heatmap  (0) 2020.03.31
데이터 시각화 실습  (0) 2020.03.31
fb prophet  (0) 2020.03.25