카테고리 없음

시계열 데이터 - 정상성(Stationary), ADF 검정

정호랭이 2023. 11. 3. 15:01

시계열 데이터를 다루는 프로젝트를 진행하다가

'정상성'과 정상성을 검증하기 위한 'ADF검정'이라는 내용에 대해 접하게 되어 정리

 

 

정상성(Stationarity)이란?

시계열 데이터의 정상성이란, 시간에 따른 평균, 분산, 그리고 자기 상관성이 일정한 것을 말한다.
정상성을 가진 시계열 데이터는 다양한 시계열 분석 방법에 적합하다.

 

 

ADF 검정(Augmented Dickey-Fuller test)

ADF 검정은 시계열 데이터가 정상성을 따르는지 여부를 가설 검정하는 방법 중 하나.
다양한 검정방법 중 가장 널리 사용되는 방법이다.

 

ADF 검정은 다음과 같은 가설을 세워 검정을 수행
- 귀무가설(H0) : 시계열 데이터는 정상성을 따르지 않는다.
- 대립가설(H1) : 시계열 데이터는 정상성을 따른다.

p-value가 0.05보다 작으면 대립 가설을 채택 (시계열 데이터가 정상성을 따른다는 것을 의미)
p-value가 0.05보다 크면 귀무가설을 채택 (시계열 데이터가 정상성을 따르지 않는다는 것을 의미)

 

 

시계열 데이터가 정상성을 따르지 않는 경우

다음과 같은 방법으로 데이터 처리 후 예측 및 분석 가능

  • 차분 : 시계열 데이터의 1차 차분을 취하여 추세를 제거
    • 시계열 데이터의 1차 차분 : 시계열 데이터의 현재 값과 이전 값의 차이
    • 1차 차분을 취하면 시계열 데이터의 추세가 제거되어 정상성을 만족하게 된다.
  •  로그 변환 : 시계열 데이터에 로그를 취하여 분산을 일정하게 만든다.
    • 시계열 데이터의 로그 변환은 시계열 데이터의 절대값을 제거하여 분산을 일정하게 만든다.
  •  기타