소개글
거시경제학에서 08년 베이징올림픽 메달수에 대하여 인구, GDP, GNI, 국토면적, 초등학교 진학률, 평균수명, External debt, 지역(나라의 위치)를 설명변수로 잡아서 통계패키지 SAS를 사용하여 회귀분석을 실시하였습니다. 통계학적 outlier들을 leverage point, influential point를 이용하여 제거하고, Weight Least Square 모델을 지역 변수를 weight값으로 잡아서 사용하였습니다. 선형성, 정규성, 등분산성, 독립성 진단까지 포함하였습니다.
리포트 점수 만점받았습니다.
목차
1. 서론
2. 각 변수들의 기초 통계량
3. 각 변수들 간의 피어슨 상관계수
4. 국가규모(인구, 국토면적) 변수와 경제지표(GDP, GNI, External debt) 변수 선택
5. 총 메달 수가 0인 국가들을 제외하고 설명변수를 국가규모(인구, 국토면적) 변수와 경제지표(GDP, GNI, External debt) 변수 선택
6. GDP와 인구 변수 선택
7. 국가 규모 변수(인구, 국토인구), 경제 지표 변수(GDP, GNI, External debt), 기타 지표(초등학교 진학률, 평균수명) 선택
8. 최종 모형의 선택
9. 결론
본문내용
1. 서론
08년 베이징 올림픽 참가국 전체에 대하여 국가별 총 메달수를 반응변수로, 인구, GDP, GNI, 국토면적, 초등학교 진학률, 평균수명, External debt, 지역(나라의 위치) 총 8개의 설명변수로 통계패키지 SAS를 사용하여 회귀분석을 실시하였다.
여기서 국가 규모 변수를 인구, 국토인구, 지역으로 잡았으며, 경제 지표 변수를 GDP, GNI, External debt로, 기타 지표를 초등학교 진학률, 평균수명으로 설정하였다.
베이징 국가별 총 메달수는 베이징 올림픽 공식 홈페이지
(http://en.beijing2008.cn/en_index.shtml/)를 참조하였으며,
인구와 GDP, GNI는 Worldbank의 07년 말 data를 참조하였고, 국토면적과 초등학교 진학률, 평균수명, External debt는 Worldbank의 06년 data를 참조하였다.
※ 선형회귀분석의 전제조건
① 선형성 : 독립변수와 종속변수의 관계는 선형관계식으로 표현할 수 있다.
② 정규성 : 오차항들은 정규분포를 따른다.
③ 등분산성 : 오차항들의 분산은 모든 값에 대하여 동일하다. 즉,
④ 독립성 : 오차항들은 서로 독립이다. 즉,
2. 각 변수들의 기초 통계량
4. 국가규모(인구, 국토면적) 변수와 경제지표(GDP, GNI, External debt) 변수 선택
- 단계적 선택법(Stepwise selection)사용 : 모형에 설명변수를 하나씩 추가하면서, 남아 있는 설명 변수들로 인해 중요도가 낮아지는 설명 변수를 제거하는 방법을 반복 실행하여 추가되거나 제거되는 변수가 없을 때 까지 수행하는 방법
분석 : 단계적 변수 선택법(Stepwise Selection)을 통해 와 , 의 변수가 선택되었다.
참고 자료
regression analysis by example 4th edition의 내용