시간의 흐름에 따라 관찰된 값 미래의 값을 예측하고 경향, 주기, 계절성 등을 파악하여 활용
시계열 자료의 종류
비정상성 시계열 자료
대부분의 시계열 자료
특정 기간의 시계열 자료로부터 얻은 정보를 다른 시기로 일반화 할 수 없음
정상성 시계열 자료
다루기 쉬운 시계열 자료로 변환한 자료
정상성이란?
모든 시점에 대해 일정한 평균을 가짐 (→ 차분)
→ 평균이 일정하지 않은 시계열은 차분(difference)을 통해 정상화. 차분이란 현 시점의 자료값에서 전 시점의 자료를 빼는 방법
분산도 시점에 의존하지 않고 일정해야 함 (→ 변환)
→ 분산이 일정하지 않은 경우 변환(Transformation)을 통해 정상화
공분산은 단지 시차에만 의존하고 실제 특정 시점에는 의존하지 않는다.
일변량 시계열분석(단변량 시계열분석)
시간을 설명변수로 한 회귀모형주가, 소매물가지수 등 하나의 변수에 관심을 갖는 경우의 시계열분석
이동평균법 (일정기간 추세)
일정기간별 이동평균을 계산하고, 이들의 추세를 파악하여 다음 기간을 예측하는 방법
시계열 자료에서 계절변동과 불규칙변동을 제거하여 추세변동과 순환변동만 가진 시계열로 변환하는 방법으로도 사용됨
간단하고 쉽게 미래를 예측 가능 → 자료의 수가 많고 안정된 패턴을 보이는 경우 예측의 품질이 높음
특정 기간 안에 속하는 시계열에 대해서 동일한 가중치 부여
뚜렷한 추세가 있거나 불규칙변동이 심하지 않으면 짧은 기간의 평균을 사용, 불규칙변동이 심한 경우 긴 기간의 평균
적절한 기간을 사용하는 것이 중요(적절한 n의 개수를 결정하는 것)
지수평활법 (최근 시계열 더 가중치)
모든 시계열 자료를 사용하여 평균을 구함
시간의 흐름에 따라 최근 시계열에 더 많은 가중치를 부여하여 미래를 예측
단기간에 발생하는 불규칙변동을 평활
가중치의 역할을 하는 것은 지수평활계수(a)
→ 불규칙변동이 큰 시계열은 작은 지수평활계수를 적용
→ 불규칙변동이 작은 시계열은 큰 지수평활계수를 적용
→ 예측 오차를 비교하여 에측오차가 가장 작은 값을 적용하는 것이 바람직함
→ 과거로 갈수록 지속적으로 감소
→ 중기 예측 이상에 주로 사용 (단순지수 평활법은 장기추세나 계절변동이 포함된 시계열의 예측에는 적합하지 않음)
다중 시계열분석(다변량 시계열분석)
계량경제 모형, 전이함수 모형, 개입분석, 상태공간 분석, 다변량 ARIMA 등
여러개의 시간에 다른 변수들을 활용하는 시계열 분석
시계열모형
자기회귀 모형(AR)
p시점 전의 자료가 현재 자료에 영향을 줌, 과거 값을 사용하여 설명
이동평균 모형(MA)
유한한 개수의 백색잡음의 결합 이므로 언제나 정상성을 만족
항상 정상성을 만족하므로 정상성에 대한 가정 불필요
자기회귀모형(AR)과 반대로 자기상관함수(ACJF)에서 절단점을 갖고, 편자기상관함수(PACF)가 빠르게 감소
자기회귀누적이동평균 모형(ARIMA)
비정상시계열 모형
→ 차분이나 변환을 통해 자기회귀모형(AR) 이나 이동평균 모형(MA), 이 둘을 합친 ARMA 모형으로 정상화 가능
ARIMA(p,d,q) = ARMA(p,q)
→ p = 0 : IMA(d,q) → d번 차분 MA(q)
→ q = 0 : ARI(p,d) → d번 차분 AR(p)
분해 시계열(요소분해법)
시계열에 영향을 주는 일반적인 요인을 시계열에서 분리해 분석하는 방법 (회귀분석적인 방법 주로 사용)
경향(추세)요인
자료가 오르거나 내리는 추세, 선형, 이차식 형태, 지수적 형태
계절요인
요일, 월, 사계절 각 분기에 의한 변화 등
고정된 주기
에 따라 자료가 변하는 경우
순환요인
경제적이나 자연적인 이유 없이
알려지지 않은 주기
를 가지고 변화하는 자료
불규칙요인
위의 세 가지 요인으로 설명할 수 없는 오차에 해당하는 요인
'🥇 certification logbook' 카테고리의 다른 글
분석환경 설정 (Visual Studio Code + 주피터노트북) (0) | 2023.06.05 |
---|---|
[ADsP] 비지도학습 - 주성분 분석(PCA) (0) | 2023.06.05 |
[ADsP] 비지도학습 - 연관 분석 (0) | 2023.06.05 |
[ADsP] 지도학습 - 분류 분석 (0) | 2023.06.05 |
[ADsP] 지도학습 - 회귀분석 (0) | 2023.06.04 |
분석환경 설정 (파이썬 + 주피터노트북 + pandas) (0) | 2023.06.03 |
[ADsP] 확률분포 (0) | 2023.06.03 |
[ADsP] 데이터마이닝 (0) | 2023.06.03 |