UNITEX를 이용한 LGG 분석 보고서
- 최초 등록일
- 2014.12.23
- 최종 저작일
- 2013.09
- 6페이지/
한컴오피스
- 가격 1,000원
![할인쿠폰받기](/images/v4/document/ico_det_coupon.gif)
목차
1. LGG 방법론과 UNITEX 프로그램이란?
1.1 LGG 그래프 방법론
1.2 UNITEX 프로그램
2. LGG 그래프 구축
3. LGG 그래프 결과 분석
4. LGG 그래프 결과 보완
5. 참고문헌
본문내용
Ⅰ. LGG 방법론과 UNITEX 프로그램이란?
1. LGG 그래프 방법론
LGG(Local Grammar Graph)문법은 프랑스 전산어학자 모리스 그로스 (Maurice Gross)에 의해 제안된 언어기술 모델로서 특정 영역별로 부분적인 언어 정보를 유한 오토마타 (FSA: Finite-State Automata) 문법의 형태로 구현하여 이를 이용하여 자연언어 텍스트에 대한 자동 분석 및 생성, 정보 추출 등을 수행하는 것을 목적으로 한다[4]. 특징으로는 문법을 방향성 비순환 그래프(Directed Acyclic Graph) 방식으로 구성함으로써 문법구성의 용이성과 문법에 대한 가독성을 극대화하였다. 또한 제한된 문맥에서 나타내는 중의성의 문제를 해결하기 위한 중의성 해소문법을 구성하는 데에도 사용된다.
LGG 그래프 표상 방식은 동의 관계의 일련의 언어 표현들의 논리적조합의 가능성을 효과적으로 검토하고 기술하는 것을 가능하게 하며, 문법의 가독성이 뛰어나기 때문에 언어학자가 이를 수정하거나 보완하는 작업을 매우 용이하게하는 장점을 가진다.
2. UNITEX 프로그램
그래프 형식으로 표상되는 LGG 문법에 기반 하여 텍스트의 자동 분석 및 생성, 정보 추출 등을 수행하기 위해서 LGG문법을 실제 텍스트에 적용할 수 있는 파서가 요구된다. 현재 마른느-라-발레 대학의 IGM 연구소에서 개발된 UNITEX 프로그램은 그로스 교수에 의해 주도된 프랑스 파리 7대학의 LADL 연구소에서 구현된 INTEX 프로그램(Max silberztein 1993)의 후속 버전으로 이와 같은 텍스트 처리를 가능하게 해주는 프로그램이다.
UNITEX 시스템은 기본형 사전으로부터 일정 활용 정보 코드를 이용하여 활용형 사전을 자동 생성하는 기능을 제공한다. 현재 프랑스어, 영어 등 몇 가지 언어의 경우 이와 같은 사전이 제공되고 있으나, 그 외의 다른 언어에서도 시스템에서 요구하는 동일한 방식의 활용 정보 코드 체계가 부착된 기본형 사전을 구성하여 활용형 사전을 컴파일(compile) 할 수 있다.
참고 자료
김명관, 이영우. 논문 ‘웹 문서 정보추출과 자연어처리를 통한 온톨로지 자동구축에 관한 연구’ , 2009년.
남지순. 웹문서 의미 지식 추출을 위한 LGG의 구축. 한국프랑스어문교육학회논문지, 25권, 한국프랑스어문교육학회, 2007년, pp. 105-128.