엑셀(Excel)을 이용한 시계열분석(이동평균법, 지수평활법 등)
*영*
다운로드
장바구니
소개글
통계학에서 시계열 분석이란 시간의 경과에 따라 순서대로 관측되는 값(시계열 자료-Time series)을 대상으로 이들의 추세, 변동요인 등을 파악하여 자료의 패턴을 유추함으로써 미래에 대해 예측하는 기법입니다. 시계열자료의 예로는 연도별 도매물가지수, 월별 소비자물가지수, 일별 주가지수, 월별 판매량, 월별 강수량 등이 있으며 우리 주위에 수없이 많이 존재합니다. 이러한 자료를 시계열자료라고 하며, 이 자료를 분석하는 것이 시계열 분석이라고 할 수 있습니다.본 자료에서는 시계열 분석과 관련한 자세한 이론적 배경이나 현재까지 개발된 다수의 최신 시계열자료 분석기법(ARMA모형, ARIMA모형 등)에 대해서는 별도로 설명하지 않습니다. 본 자료의 제목과 같이 엑셀 2007에서 시계열 통계자료 분석을 위하여 기본으로 제공하는 “이동평균법”과 “지수평활법”에 대하여 이론적 배경을 설명한 다음, 샘플데이터를 이용하여 실제 엑셀에서 이동평균법과 지수평활법을 어떻게 적용하는지를 설명합니다.
이동평균법과 지수평활법은 시계열자료의 급격하며 불규칙한 변동을 완화하여 전반적인 추세를 뚜렷하게 나타내게 하는 평활법(smoothing method)의 한 종류입니다. 따라서 미래값의 예측보다는 전반적인 추세를 파악하는데 주로 이용됩니다.
이제 excel 2007을 이용하여 시계열자료에 이동평균법과 지수평활법을 적용한 분석을 해보겠습니다.
목차
1.시계열 분석이란?2.단순이동평균법
2.1 기초데이터
2.2 엑셀을 이용한 단순이동평균법
3.가중이동평균법
3.1 기초데이터
3.2 엑셀을 이용한 가중이동평균법
4.지수평활법
4.1 기초데이터
4.2 엑셀을 이용한 지수평활법
본문내용
통계학에서 시계열 분석이란 시간의 경과에 따라 순서대로 관측되는 값(시계열 자료-Time series)을 대상으로 이들의 추세, 변동요인 등을 파악하여 자료의 패턴을 유추함으로써 미래에 대해 예측하는 기법입니다. 시계열자료의 예로는 연도별 도매물가지수, 월별 소비자물가지수, 일별 주가지수, 월별 판매량, 월별 강수량 등이 있으며 우리 주위에 수없이 많이 존재합니다. 이러한 자료를 시계열자료라고 하며, 이 자료를 분석하는 것이 시계열 분석이라고 할 수 있습니다.본 자료에서는 시계열 분석과 관련한 자세한 이론적 배경이나 현재까지 개발된 다수의 최신 시계열자료 분석기법(ARMA모형, ARIMA모형 등)에 대해서는 별도로 설명하지 않습니다. 본 자료의 제목과 같이 엑셀 2007에서 시계열 통계자료 분석을 위하여 기본으로 제공하는 “이동평균법”과 “지수평활법”에 대하여 이론적 배경을 설명한 다음, 샘플데이터를 이용하여 실제 엑셀에서 이동평균법과 지수평활법을 어떻게 적용하는지를 설명합니다.
먼저 시계열자료 분석과 관련한 일반적 사항에 대하여 살펴보겠습니다. 시계열자료는 일반적으로 장기적 추세(trend), 계절적 변동(seasonality), 순환변동(cycle), 불규칙변동(random fluctuation)의 4가지 요소의 조합으로 설명될 수 있다고 가정하고 있습니다. 각각에 대하여 살펴보면
-장기적 추세(trend): 시계열 자료에서 장기간의 시간흐름에 따른 움직임(지속적, 상승 또는 하강 등)을 나타내는 요소(예: 국민총생산, 인구성장률 등)
-계절적 변동(seasonality): 계절적인 요인(요일별, 월별, 분기별 등 포함)에 의하여 일정한 주기로 반복하는 변동. (예: 아이스 크림 판매량, 전력소비량, 난방유 소비량처럼 계절에 따라 상승과 하락을 반복하는 자료)
-순환변동(cycle): 경기변동처럼 어느 정도의 주기를 가지고 순환적으로 상승과 하락을 반복하는 변동(예: 경기변동 등)
-불규칙변동(random fluctuation): 규칙성이 없고 예측할 수 없는 변동(예: 전쟁, 홍수, 화재, 지진 등)
이동평균법과 지수평활법은 시계열자료의 급격하며 불규칙한 변동을 완화하여 전반적인 추세를 뚜렷하게 나타내게 하는 평활법(smoothing method)의 한 종류입니다. 따라서 미래값의 예측보다는 전반적인 추세를 파악하는데 주로 이용됩니다. 이동평균법에 있어 중요한 문제는 이동평균을 계산하기 위한 과거자료 n의 개수를 결정하는 것입니다. 일반적으로 불규칙변동이 심하지 않을 경우에는 작은 n값을, 반대로 불규칙변동이 심할 경우는 큰 n값을 잡습니다. 그리고 예측오차(MAD, MSE)를 비교하여 그 오차가 작은 n 값을 선택하는 것이 좋습니다.(MAD: 예측오차[et=(t기의 관측치)-(t기의 예측치)]의 절대값 평균, MSE: 예측오차[et=(t기의 관측치)-(t기의 예측치)]의 제곱값 평균)
그리고 이동평균법은 n개의 최근 자료로 다음기간의 자료를 예측하는 계산방법상의 특성상 처음의 일부기간(n개 또는 n-1개)에 대한 예측값을 구할 수 없다는 단점이 있습니다. 여기에서 최근자료 n개의 의미는 각 통계학 서적마다 다르게 설명하고 있습니다. 즉, 특정시점 t를 중심으로 앞, 뒤의 자료를 선택하고 계산된 이동평균값을 n개 시점중 가운데 시점의 예측치로 사용하는 방법, t시점을 포함한 최근 과거 n 기간 동안의 자료를 선택하고 계산된 이동평균값을 t+1시점의 예측치로 사용하는 방법 등이 있으며 이는 시계열자료의 특성에 따라 다르게 적용할 수 있으니 참고하시기 바랍니다.
excel에서는 t시점을 포함한 최근 과거 n 기간 동안의 자료를 선택하여 계산된 이동평균값을 t시점에 표시하되 t+1시점에서의 예측치로 사용합니다.
그리고 지수평활법에서 평활계수 α는 가중치 역할을 하는 것으로 불규칙 변동이 큰 자료에서는 작은 값의 α를, 불규칙 변동이 작은 자료에서는 큰 값의 α를 적용합니다. 통상 0.05와 0.3사이의 값을 사용하는 것이 일반적입니다. 그리고 이동평균법과 마찬가지로 예측오차(MAD, MSE)를 비교하여 그 오차가 작은 α 값을 선택하는 것이 좋습니다. 지수평활법 계산식의 특성상 가중치는 과거로 올라갈수록 지수적으로 감소하게 됩니다. 그러므로 지수평활법에서는 최근 과거치에 가장 큰 가중치를 부여하게 됩니다.
이제 excel 2007을 이용하여 시계열자료에 이동평균법과 지수평활법을 적용한 분석을 해보겠습니다.