소개글
웹마이닝(Web Mining)이란 웹 문서와 서비스로부터 자동으로 정보를 발견하고 추출하기 위해 데이터마이닝 기법을 이용하는 것이다. 즉, 웹 데이터로부터 미리 알려지지 않은 유용한 정보나 지식을 발견하는 과정이라고 정의할 수 있다.웹마이닝의 연구 분야는 정보검색(Information Retrieval) 혹은 정보추출(Information Extraction)의 분야에서 연구하고 있는 많은 부분을 공유하고 있다.
정보검색은 웹 문서를 색인화 하여 유용한 문서를 검색하는 것이 주 목적이다. 이를 위해 문서의 분류, 카테고리화와 검색을 위한 사용자 인터페이스 개발, 부적절한 문서 필터링 등이 연구의 중심을 이루고 있다. 정보검색의 웹 문서 분류 및 카테고리화 같은 기법은 웹마이닝 태스크에도 자주 적용되는 기법이다.
정보검색이 적절한 문서를 선택하는 것에 비해 정보추출은 문서로부터 적절한 사실을 추출하는 기법이다. 정보추출은 입력 데이터에 따라서 비구조화된 문서에서의 정보추출과 반구조화된 문서에서의 정보추출로 분류된다. 비구조화된 문서에서의 정보추출은 자연언어 커뮤니티에서 주로 연구되어 온 분야로 자연어 처리를 위한 언어학적 기법이 필요하다. 반구조화된 문서에서의 정보추출은 문서의 메타정보를 이용하는 것으로 정보추출을 위해 데이터마이닝이나 기계학습 기법을 이용한다.
목차
1. 웹마이닝의 정의1.1 웹마이닝 분류
1.2 웹 컨텐트 마이닝
1.3 웹 구조 마이닝
1.4 웹 사용 마이닝
2. 결 론
본문내용
웹마이닝(Web Mining)이란 웹 문서와 서비스로부터 자동으로 정보를 발견하고 추출하기 위해 데이터마이닝 기법을 이용하는 것이다. 즉, 웹 데이터로부터 미리 알려지지 않은 유용한 정보나 지식을 발견하는 과정이라고 정의할 수 있다[KB00].웹마이닝의 연구 분야는 정보검색(Information Retrieval) 혹은 정보추출(Information Extraction)의 분야에서 연구하고 있는 많은 부분을 공유하고 있다.
정보검색은 웹 문서를 색인화 하여 유용한 문서를 검색하는 것이 주 목적이다. 이를 위해 문서의 분류, 카테고리화와 검색을 위한 사용자 인터페이스 개발, 부적절한 문서 필터링 등이 연구의 중심을 이루고 있다. 정보검색의 웹 문서 분류 및 카테고리화 같은 기법은 웹마이닝 태스크에도 자주 적용되는 기법이다.
정보검색이 적절한 문서를 선택하는 것에 비해 정보추출은 문서로부터 적절한 사실을 추출하는 기법이다. 정보추출은 입력 데이터에 따라서 비구조화된 문서에서의 정보추출과 반구조화된 문서에서의 정보추출로 분류된다. 비구조화된 문서에서의 정보추출은 자연언어 커뮤니티에서 주로 연구되어 온 분야로 자연어 처리를 위한 언어학적 기법이 필요하다. 반구조화된 문서에서의 정보추출은 문서의 메타정보를 이용하는 것으로 정보추출을 위해 데이터마이닝이나 기계학습 기법을 이용한다.
1.1 웹마이닝 분류
웹마이닝은 크게 웹 컨텐트 마이닝(Web Content Mining), 웹 구조 마이닝(Web Structure Mining), 웹 사용 마이닝(Web Usage Mining)으로 분류된다[KB00].
웹 컨텐트 마이닝은 문서, 이미지, 오디오, 비디오 등의 웹 컨텐트, 데이터, 문서로부터 유용한 정보를 발견하는 것이다. 아직까지 웹 컨텐트 마이닝은 연구가 미미한 편이며 텍스트마이닝(Text Mining) 분야에서 주로 연구되고 있다. 웹 컨텐트 마이닝은 비구조화된 문서를 이용하는 정보검색의 관점과 웹 데이터에 복잡한 질의를 수행하기 위해 데이터베이스로 모델화하고 통합하는 데이터베이스 관점으로 분류된다.
참고 자료
[김양욱98] 김양욱 편, “업무혁신을 위한 ERP”, 21세기북스, 1998.[김영만98] 김영만, “통신서비스 시장에서 데이터마이닝을 이용한 이탈고객 분석”, 한국과학기술원 석사논문, 1998.
[노형진99] “다변량 데이터의 통계분석”, 석정, 1999.
[민재형00] 민재형, 이영찬, “자기조직화 신경망을 이용한 경쟁적 벤치마킹”, 한국지능정보시스템학회 2000년 가을 학술대회, 2000.
[박종수98] 박종수, “연관 규칙 탐사 알고리즘에 대한 조사”, 6월, 1998.
이 자료와 함께 구매한 자료
- 웹마이닝[데이타마이닝] 54페이지
- 웸마이닝 11페이지
- [텍스트 마이닝]텍스트마이닝(Text Mining) 10페이지
- [시스템엔지니어링]인텔리전트 에이전트(Intelligent Agent) 5페이지
- [데이터베이스]추천 시스템을 중심으로 한 데이터 마이닝의 기법과 응용 12페이지