데이터 클러스터링을 위한 혼합 시뮬레이티드 어닐링
* 본 문서는 배포용으로 복사 및 편집이 불가합니다.
서지정보
ㆍ발행기관 : 한국산업경영시스템학회
ㆍ수록지정보 : 산업경영시스템학회지 / 40권 / 2호
ㆍ저자명 : 김성수, 백준영, 강범수
ㆍ저자명 : 김성수, 백준영, 강범수
영어 초록
Data clustering determines a group of patterns using similarity measure in a dataset and is one of the most important and difficult technique in data mining. Clustering can be formally considered as a particular kind of NP-hard grouping problem. K-means algorithm which is popular and efficient, is sensitive for initialization and has the possibility to be stuck in local optimum because of hill climbing clustering method. This method is also not computationally feasible in practice, especially for large datasets and large number of clusters. Therefore, we need a robust and efficient clustering algorithm to find the global optimum (not local optimum) especially when much data is collected from many IoT (Internet of Things) devices in these days. The objective of this paper is to propose new Hybrid Simulated Annealing (HSA) which is combined simulated annealing with K-means for non-hierarchical clustering of big data. Simulated annealing (SA) is useful for diversified search in large search space and K-means is useful for converged search in predetermined search space. Our proposed method can balance the intensification and diversification to find the global optimal solution in big data clustering. The performance of HSA is validated using Iris, Wine, Glass, and Vowel UCI machine learning repository datasets comparing to previous studies by experiment and analysis. Our proposed KSAK (K-means+SA+K-means) and SAK (SA+K-means) are better than KSA(K-means+SA), SA, and K-means in our simulations. Our method has significantly improved accuracy and efficiency to find the global optimal data clustering solution for complex, real time, and costly data mining process.참고 자료
없음"산업경영시스템학회지"의 다른 논문
- 스마트폰 구매결정 요인이 재구매 의도에 미치는 영향12페이지
- 중소기업의 외부 기술협력 네트워크의 다양성과 생산성 향상 : 최고기술경영자가 주도하는 기술 개발의 ..5페이지
- 공구유연성과 공구관련제약을 고려한 통합공정일정계획을 위한 유전알고리즘10페이지
- 경로분석을 이용한 사업의 효과성 분석 : 플랜트엔지니어링사업을 중심으로7페이지
- 손실 비용을 고려한 공정 파라미터 허용차 산출 : 망대 특성치의 경우8페이지
- 사회적 기업의 자료포락분석(DEA)을 통한 경영효율성 평가8페이지
- 정밀제조를 위한 기하공차에서의 윤곽공차 사용5페이지
- 비즈니스 규칙 기반의 3자 물류 운영 지원8페이지
- 항공사 비정상 운항 복구를 위한 리-타이밍 전략과 개미군집최적화 알고리즘 적용9페이지
- 전사적 PL 대응시스템의 핵심요인이 기업 성과에 미치는 영향9페이지