[국어정보학] 기계번역과 빅데이터, 전자사전
- 최초 등록일
- 2016.12.20
- 최종 저작일
- 2016.11
- 10페이지/
한컴오피스
- 가격 1,000원
![할인쿠폰받기](/images/v4/document/ico_det_coupon.gif)
소개글
국어정보학을 수강하는 학생들을 위해 혹은 국어정보학에 관심이 있는 분들을 위해 정리한 노트입니다.
목차
없음
본문내용
기계번역은 언어의 장벽을 넘기 위한 과정이며, 정형화된 문장패턴의 경우 빠른 처리를 통한 효율성을 증가시킬 수 있다. 실제로 컴퓨터를 통한 국경 없는 세계적 접근이 가능해졌으나, 언어의 장벽으로 인하여 제대로된 정보를 찾지 못하는 경우가 발생한다고 한다.
기계번역이 추구하는 지향점은 궁극적으로 실생활에서 쓰이는 자연언어 상태로까지 처리 할 수 있어야 한다.
<중 략>
직접변환방식 : 출발언어의 단어를 목표언어의 단어로 교체하는 방식이다. 입력문장에 대한 형태소 분석정도만 이루어지고 구조분석, 의미분석등은 이루어지지 않는다. 단어 레벨의 교체가 이루어지면 목표언어의 문법에 맞는 간단한 규칙 등을 적용하여 문법적인 문장이 나오도록 한다. 처리가 간단하기 때문에 속도가 빠르다는 장점이 있지만, 정밀한 번역은 불가능하다는 단점이 있다.
간접변환방식 : 출발언어 문장에 대한 형태소, 구문, 의미, 화용론적 분석이 이루어진 후 출발 언어의 표상으로부터 목표연어의 표상으로의 매핑이 일어나야 한다. 그리고 목표언어의 표상으로부터 목표언어 문장을 생성한다. 비교적 단시간 내에 구축이 용이하고 어느 정도의 번역률을 올릴 수 있다. 하지만 규칙 관리가 어려우며 규칙이 많아짐에 따라 관리가 어려워진다. 규칙간의 충돌이 일어나 오류가 발생할 수 있다. 중간 언어 방식 : 어떤 문장에 대해 언어 중립적인 의미표상을 만들 수 있다면, 각각의 언어 간에 변환이 필요 없이 이 중립표상만으로 번역을 할 수 있다.
<중 략>
예제 기반 방식 : 인간의 번역 방식을 따라 유사한 문장들은 유사하게 번역된다. 입력문과 가장 유사한 예문을 찾고 예문과 다른 경우 대역어 코퍼스를 참조해 후에 번역된 단어들을 제 위치에 배열하는 방식이다. 단순히 대역코퍼스 추가로 번역 가능, 양방향 번역 지원, 예제를 통한 고품직의 번역이 가능하다. 하지만 언어의 생산성 지원 문제, 대역코퍼스 획득 문제, 유사성 계산을 할 훌량한 시소러스가 필요하다.
참고 자료
없음