한국방송통신대학교 통계데이터과학과 다변량분석 2022년 출석과제(만점)
- 최초 등록일
- 2024.07.11
- 최종 저작일
- 2022.03
- 50페이지/ 한컴오피스
- 가격 5,000원
목차
1. 문제
2. 참고 문헌
본문내용
2장 연습문제 3번
다음은 어느 도시의 14개 지역에 대한 사회조사자료이다. 이 자료를 이용하여 다음과 같이 주성분분석을 실시하시오.
(1) R을 이용하여 다음과 같이 주성분분석을 실시하고 결과를 비교하시오.
① 5개 변수들 사이의 상관계수행렬을 구하시오.
② 고윳값을 구하고 그 고윳값이 확보하는 정보의 양 및 누적정보량을 구하시오.
③ 1보다 큰 고윳값과 그 고윳값들이 확보하는 누적정보의 양을 구하시오.
④ 위 결과를 이용하여 주성분분석을 하시오.
(2) 파이썬을 이용하여 주성분분석을 실시하고 R의 결과와 비교, 분석하시오.
3장 연습문제 2번
다음 자료는 300명의 대학생에게 biology(BIO), geology(GEO), chemistry(CHEM), algebra(ALG), calculus(CALC), statistic(STA) 6개의 과목에 대해 선호도를 조사한 결과이다. R과 파이썬을 각각 이용하여 인자분석을 실행하고 물음에 답하시오.
(1) 유의한 인자의 수와 그 인자들이 확보하는 정보의 양은 얼마인가?
(2) 인자부하행렬을 구하고 varimax와 promax 방법을 이용하여 인자회전을 실시하고 결과를 비교하시오.
(3) 인자들에 적절한 이름은?
(4) 인자분석 결과를 종합적으로 정리하시오.
4장 연습문제 3번
세계의 46개 주요 도시에 대한 물가와 소득에 관한 데이터를 아래와 같이 수집하였다.(1991년 기준). R과 파이썬을 각각 이용하여 46개 도시에 대한 군집분석을 다음과 같이 실시하이오.
(1) 각 변수로 관찰값들을 표준화하시오.
(2) 최장연결법을 이용하여 도시들을 군집화하고 덴드로그램으로 표현하시오. 몇 개의 군집이 적절하다고 판단되는지 설명하시오.
(3) K-평균 군집분석방법을 이용하여 4개 군집에 대한 군집분석을 실시하시오.
(4) K-평균 군집분석의 군집결과를 이용하여 판별분석을 수행하고, 군집분석의 타당성을 설명하시오.
참고 자료
R과 파이썬을 이용한 다변량 분석 (김성수 외 2인 공저, 한국방송통신대학교 출판문화원, 2022년)
R을 활용한 다변량 자료분석 방법론 (강현철 외 2인 공저, 자유아카데미, 2021년)