비즈니스데이터마이닝
- 최초 등록일
- 2011.01.20
- 최종 저작일
- 1997.01
- 42페이지/ 압축파일
- 가격 4,500원
소개글
데이터마이닝 수업을 들으며 수행했던 과제 내용입니다. 자세한 방법과 풀이과정이 적혀 있으므로 참고하셔서 사용하시면 좋을것 같습니다.7개 엑셀파일과 총정리한 1개 한글파일이 있습니다.
목차
제1부
서 론
가.조 사 의 필 요 성 및 진 행 방 법
제2부
문 제 1
가. 집값을 결정하는 주요설명 변수
나.주요설명 변수중 가장 중요한 변수와 이유
다.규칙생성 후 IF-THEN 형태로 정리 / 의미설명
라.위치에 따른 집값의 규칙과 의미 설명
마.특성에 따른 집값의 변화
제3부
문 제 2
가. 로지스틱 회기를 통한 당뇨의 설명 변수
나. 베이지안으로 구한 설명변수와 로지스틱과의 차이점
제4부
참고문헌
각 방법론 설명 요약
본문내용
Ⅰ. 서론
우리는 생활에서 방대한 자료 또는 정보(DATA)를 접하게 된다. 이러한 개개의 자료를 접할 때 우리는 그 자료에서 큰 의미를 도출할 수 없다. 하지만 이러한 자료를 토대로 DATA BASE를 구축한다면 자료에 대한 활용도가 크게 증가할 것이다. 나아가 DATA BASE를 토대로 의미 있는 정보를 추출해내는 DATA MINING 과정을 거친다면 미래 유사한 사건에 대한 예측과 분류에 있어 큰 도움을 얻을 수 있을 것이고, 직장에서 업무와 관련한 자료, 실생활 등에 유연한 적용이 가능할 것이라 생각된다.
이하에서는 XLminer라는 프로그램을 이용하여, 집값, 당뇨병 여부에 대한 예측, 분류에 이러한 DATA MINING 개념을 적용시켜 의미 있는 결과를 도출해 보고자 한다.
Ⅱ. 과제 1-1
1. 문제설명
1) 목적
집값(price)를 종속변수로 설정하고, 설명변수로는 SQFT, AGE, FEATS, NE, CUST, COR, TAX를 사용하여 관계가 있는 변수를 찾아내고 이를 이용하여 주택가격을 결정하는 모형 구축을 목적으로 한다.
2) 관측값의 개수
・자료개수 : N=117
・변수개수 : 9
3) 변수설명
・PRICE : 집값(단위: $100)
・SQFT : 전용면적(단위:Square feet)
・AGE : 주택의 사용기간 (단위:years)
・FEATS : 편의시설개수 (11개 편의시설 : 냉장고, 식기세척기, 전자레인지, 세탁기, 건조기, 싱크대분쇄기, 인터폰, 천장채광창, 장애인시설, 쓰레기압축기, 케이블TV시설)
참고 자료
없음
압축파일 내 파일목록
15조_본과제_비즈데이터마이닝.hwp
과제1_FEATS_회귀분석.xlsm
과제1_Regression_Tree_(SQFT,CUST,TAX).xlsm
과제1_multiple_Regression.xlsm
과제1_위치_회귀분석.xlsm
과제2_로지스틱분석.xls
과제2_베이지안분석_정식판사용.xls
과제2_베이지안분석_체험판.xls