R을 이용한 회귀분석
- 최초 등록일
- 2012.06.12
- 최종 저작일
- 2012.01
- 47페이지/ MS 워드
- 가격 2,000원
소개글
Modern Regression Techniques Using R(2009, Wright et al.) 정리/요약
목차
2 The basic regression
4 ANCOVA: Lord’s paradox and mediation analysis
5 Model selection and shrinkage
6 Generalized linear models(GLMs)
7 Regression splines and generalized additive models(GAMs)
8 Multilevel models
9 Robust regression
10 Conclusion – make your data cool
본문내용
2 기초 회귀분석Basic Regression(Wright and London 2009)
몇 가지 기본적인 R 명령
help(xxxx) 함수 xxxx에 대한 도움말을 볼 수 있다.
?xxxx help(xxxx)와 동일
help.search(“yyyy”) 함수명을 정확히 모를 경우 검색할 때 사용한다
abline(reg) reg이 lm함수의 결과(lm.object)일 때, 해당하는 회귀선을 그린다.
흔히 scatterplot 위에 회귀선을 그릴 때 사용한다.
ex) plot(x,y)
abline(lm(y~x))
summary(reg) 회귀분석 결과를 출력
plot(reg) 회귀분석 결과를 그래프로 출력
잔차의 독립성, 등분산성 등을 확인할 때 많이 쓰인다.
anova(reg1, reg2) 두 모형의 잔차 제곱을 비교할 때 쓰인다.
(평균을 비교할 때, R에서는 aov 함수를 사용한다.)
내포되지 않는 모형을 비교할 때에는 주의를 해야 한다!
<중략>
7 회귀 스플라인과 일반화가법모형Regression splines and generalized additive models(GAMs)(Wright and London 2009)
선형 모형linear model은 가법 모형additive model으로 확장될 수 있다. 선형 모형에서 각각의 예측 변수 X는 β와 곱해진다. 가법 모형에서 β는 간단한 함수로 대치된다. 따라서 모형은 다음과 같다.
Y_i=α+f_1 (X_1i )+f_2 (X_2i )+⋯+f_k (X_ki )+e_i
함수들은 보통 적은 수의 매듭knot이 있는 스플라인spline으로 상정된다. 좀 더 복잡한 함수가 쓰일 수도 있으나, 복잡한 함수를 쓸 경우 모형이 과적합될 위험이 있다. 그래픽 분석 결과는 함수들을 보여주고, 수치적 분석 결과는 선형/비선형 요소의 적합도를 보여준다. 함수를 선택하는 것(보통 스플라인 의 종류와 복잡도를 결정하는 것이다)이 중요하다.
<중략>
10 결론Conclusion-make your data cool(Wright and London 2009)
통계학은 1. 자연 속의 패턴을 발견하고, 2. 그것을 다른 사람에게 알리는 2가지 요소가 있다.
첫 번째 요소를 위해서 탐색적 자료 분석에서 얘기하는 4R을 언급할 필요가 있다.(Hoaglin et al., 2000)
Resistance(저항성) : 통계량은 몇몇 특이값에 의해 크게 영향받지 않아야 한다.
Residuals(잔차) : 몇몇 값들이 다른 값들과 다른 과정에 의해 발생되었는가?
Re-expression(재표현) : 가끔 원래 변수를 변환시켜야 할 필요가 있다.
Reveal(발견) : 자료가 무엇을 말하는가?
참고 자료
없음