[데이터마이닝]데이터마이닝 프로젝트 발표본
- 최초 등록일
- 2006.07.31
- 최종 저작일
- 2006.05
- 23페이지/ MS 파워포인트
- 가격 3,000원
소개글
실제로 기말고사 때 발표한 자료입니다.(ppt)
데이터마이닝의 대표적인 자료로 분석한 발표본이므로
처음 데이터마이닝 프로젝트를 하실 때 많은 도움을 줄 겁니다.
목차
1. Dataset 에 대한 설명
2. 프로젝트 노드 흐름도
3. 변수들의 변환 과정
4. Sampling, Partition, Replacement
5. Adult 데이터의 분석
6. Regression 분석
7. 신경망 분석(Neural Network Analysis)
8. Tree 분석
9. 결 론
본문내용
Age (나이) : continuous (연속형 변수)
Workclass(직업) : private (자영업),
Self-emp-not-inc (법인이 없는 개인사업가),
Self-emp-inc ( 법인이 있는 개인사업가)….
fnlwgt(미지의 변수) : continuous(연속형 변수)
Education(교육) : Bachelors (학사),
Some-college (전문대)…
트리
신경망
로지스틱회귀분석
1. Dataset 에 대한 설명 (2)
Marital – status(결혼유무) : Married-civ-spouse(기혼),
Divorced (이혼), Never-married (미혼)
Ooccupation : Tech-support(기술자)Craft-repair (기능공), Other-service (제3서비스업)
Relationship : Wife (아내), Own-child (자녀)
Husband (남편)
Race(인종) : Asian-Pac-Islander (아시아계), White (백인)
Class ( Target변수 ) : 1 (소득 50000$ 이상), 0 (50000$ 이하)
5. Adult 데이터의 분석 (5)
성직자의 학력수준 : 고졸, 전문대 多
수리공의 학력수준 : 고졸 多
경영직의 학력수준 : 학사출신 多
5. Adult 데이터의 분석(6)
또한 주당 일하는 시간과 학력수준의 관계를 설명하는 모자이크 그림은 아래와 같다.
주당 일하는 시간이 40시간인 사람들의 직종을 보면 수리공, 운송업, 고도전문직종을 가진 사람들의 비율이 가장 높음을 알 수 있다.
참고 자료
없음