[프로그래밍](자바)java로 구현한 k-means 클러스터링 프로젝트
- 최초 등록일
- 2004.05.24
- 최종 저작일
- 2004.05
- 13페이지/
압축파일
- 가격 2,000원
![할인쿠폰받기](/images/v4/document/ico_det_coupon.gif)
소개글
조별프로젝트 자바로 구현한 k-means 군집분석입니다..
3.28 -4.84
86.16 -2.44
68.41 6.33
4.215 0.15
75.75 -8.47
85.7 -0.38
35.42 -9.99
0.875 34.50
38.47 62.03
이와같은 데이터가 1000줄이 있음..
한양대학교 산업공학과 데이터구조론 수업 기말프로젝트로 사용.. 조철형강사님
목차
압축파일구성
데이터 txt 파일 2개
소스코드파일
분석 hwp파일
발표 ppt파일
본문내용
1. 클러스터링의 개요
최근에 많은 관심의 대상이 되고 있는 고객관계관리(Customer Relationship Management, CRM)나 데이터마이닝에서 사용되는 클러스터링은 실험의 결과나 표본 등에서 얻어진 사례를 어떤 성질에 따라 분류하여 동질적인 몇 개의 군집(cluster)으로 나누는 작업을 의한다. 예를 들어 기업에서 나이와 소득수준에 따른 마케팅전략을 수집하기 위해 고개을 몇 개의 그룹으로 분류하거나, 재무제표에 의해 기업을 분류하는 것, 또는 의학에서 증상에 따라 환자를 분류하거나, 재무제표에 의해 기업을 분류하는 것, 또는 의학에서 증상에 따라 환자를 분류하여 처방을 실시하는 방법 등을 말한다.
클러스터링이란 n개의 객체를 대상으로 p개의 변수들을 측정하였을 때, 이 변수들을 이용하여 n개의 객채들 사이의 유사성 또는 비유사성의 정도를 측정하여 객채들을 가까운 순서대로 연결해 나가는 분석방법이다.
클러스터링을 위한 많은 방법들이 개발되어 있는데, 우리는 계층적 클러스터링 알고리즘과 함께 가장 많이 사용되고 있는 k-Means 클러스터링 알고리즘을 구현한다.
k-Means 클러스터링은 클러스터의 개수를 k개로 미리 설정한 후, 각 객체가 어느 클러스터에 속하는 지를 분석하는 방법으로서 대량의 데이터의 클러스터링에 유용하게 이용되는 방법이다. k-Means 클러스터링 알고리즘은 다음과 같다.
① 임의로 K개의 객체를 선정하여 각 객체의 속성값을 각 틀러스터의 평균점으로 한다. ② 각 객체를 가장 가까운 평균점을 갖는 클러스터에 할당한다.
③ 클러스터의 평균점을 다시 계산하다.
④ 위의 단계 ③에서 평균점이 변경되었다면 ②단계로부터 반복하며, 평균점이 변경되지 않았으면, 클러스터링을 종료한다.
참고 자료
없음