[2015 : 방통대 데이터마이닝] 출석대체 실습과제물 : R을 활용한 교재 문제 풀이
- 최초 등록일
- 2017.06.22
- 최종 저작일
- 2015.10
- 11페이지/
한컴오피스
- 가격 3,000원
![할인쿠폰받기](/images/v4/document/ico_det_coupon.gif)
소개글
2015 한국방송통신대학교 데이터마이닝
출석대체 실습과제물 : R을 활용한 교재 연습문제 풀이
* 성실하게 작성하여 만점 받은 레포트입니다.
과제물 작성 시, 참고하시면 좋을 것 같습니다
목차
1. 1장 연습문제 2번
2. 2장 연습문제 1번, 3번
3. 3장 연습문제 3번
4. 4장 연습문제 1번
5. 5장 연습문제 1번
본문내용
[1장 연습문제 2번] 감독학습과 자율학습의 차이가 무엇인지 서술하여라.
데이터마이닝에 사용되는 기법을 기계학습이론 용어를 사용하여 구분하면 크게 감독학습 기법과 자율학습 기법으로 나눌 수 있다. 감독학습(supervised learning)은 출력결과(종속변수)가 알려진 자료로부터 입력변수(독립변수)와 출력변수 간의 관계를 결정하는 시스템을 규명하는 학습과정으로, 회귀분석 및 판별분석 등을 그 예로 들 수 있다. 반면, 자율학습(unsupervised learning)은 출력결과가 알려지지 않은 자료로부터 입출력 간의 관계를 결정하는 시스템을 찾기보다는 데이터에 존재하는 여러 가지 형태의 특징을 찾는 데 그 목표를 두는 것으로, 군집분석이나 장바구니 분석을 그 예로 들 수 있다.
일반적으로 기법은 사용자가 선택하는 것은 아니며, 변수의 존재 유무에 따라 적합한 기법을 선택하여 사용하게 된다. 감독학습은 분류와 예측을 위해 사용되는 알고리즘으로, 이를 위해서는 반드시 이용 가능한 데이터가 있어야 하며 주요 출력변수의 값이 알려져 있어야 한다. 감독학습에서는 설명변수를 가지고 모형을 적합한 후, 종속변수를 가지고 모형의 성능을 검증한다. 그러나 예측 또는 분류를 위해 필요한 출력변수가 없는 경우, 자율학습 기법이 사용된다. 자율학습에서는 입력변수만 주어지고 종속변수는 주어지지 않는다. 즉, 모형을 검증하는 변수가 주어지지 않는다는 것이다. 출력값이 존재하지 않기 때문에 자율학습에서는 입출력 간의 관계를 결정하는 시스템을 찾기보다는 데이터에 존재하는 여러 가지 형태의 특징을 찾는 데 그 목표를 둔다.
데이터마이닝 작업을 수행하는 경우 자율학습은 감독학습에 비해 목표가 구체적이지 못하여 작업이 어렵다는 단점이 있다.
[2장 연습문제 1번] 동일 업종의 두 경쟁회사에 종사하는 특정 직급의 연간 임금총액이 다음과 같이 요약되었다고 한다(단위:만 원).
<표>
(1) R를 이용하여 회사 A의 총임금에 대한 상자그림을 작성하여라.
(2) R를 이용하여 회사 B의 총임금에 대한 상자그림을 작성하고, 두 회사의 총 임금 분포를 비교하여라.
참고 자료
없음