소개글
멀티미디어 데이타에 관한 자료입니다.
멀티미디어 데이타,텍스트,유니코드,사운드등 멀티미디어 데이터에 과한 모든 정보들이 잘 정리 되어 있습니다.
목차
1.텍스트
2.그래픽과 이미지
3.사운드
4.비디오와 애니메이션
본문내용
텍스트의 특징
가장 많이 사용하는 데이터 형태
키보드를 이용하여 입력하거나 스캐너로 입력된 글을 문자인식을 통해 텍스트 데이터로 생성
텍스트의 장점
다른 매체 데이터보다 상대적으로 적은 저장공간 필요
많은 정보내용의 전달이 가능
텍스트의 표현
컴퓨터 시스템 내에서 텍스트 데이터는 2진수의 코드형태로 정보를 표현
표현 방법
영문 대문자만: 6비트 모르스 코드 ===> 26 = 64가지
7비트 ASCII 코드 ===> 2^7 = 128 가지
a ~ z, A ~ Z, #, $,...., 0, 1, ..., 9
8비트 EBCD 코드 ===> 2^8 = 256 가지
Unicode : 16비트 ===> 2^16 = 64000가지
ASCII Code
American Standard Code for Information Interchange
개인용 컴퓨터에서 일반적으로 많이 사용
기본적으로 1개의 문자를 8비트로 표현
최대 256가지 문자를 표현
실제로는 7비트로 128개의 영문자(대소문자), 문장 기호, 특수기호를 표현
나머지 1비트는 패리티 비트 또는 다른 목적으로 이용
독일어, 불어 등 : 8비트
한글코드
완성형 코드와 조합형 코드로 분류
완성형 코드
한 글자당 2바이트를 부여
한글 2,300자와 한자 4,888자 이외의 문자는 표현 불가능
조합형 코드
글자를 자음, 모음으로 분리하여 순서대로 코드로 표현
대부분의 글자 표현이 가능
컴퓨터 통신등에서 글자의 길이가 가변적이라 처리에 어려움
유니코드
한글이나 한자와 같은 글자수가 많은 언어를 표현하는데는 ASCII가 부적합
ISO에서 특정언어체계에 국한되지 않으면서 모든 언어들을 표현할 수 있는 유니코드를 제창
코드체계는 8비트 데이터인 octet으로 표현
하나의 문자는 4개의 octet으로 표현
뒤에 있는 두개의 octet만을 이용한 코드 세트를 둠
한글은 한 음절당 2바이트를 차지하며 최대 11,172자까지 표현 가능
그러나 한글 지원이 완벽하지는 않음
Mark-up Text
화면에 포맷 결과가 보이는 일반 워드프로세서와 달리 문서의 제목, 절, 목록과 같이 문서의 논리적인 단위로 지정하는 텍스트
마크업 명령어를 통해 구성된 텍스트를 해석 => 원하는 형태의 문서를 볼 수 있음
마크업 텍스트 문서를 처리해 줄 수 있는 프로그램 필요
PostScript와 HTML
텍스트 스캔
키보드를 통한 텍스트 입력은 속도의 제한 및 입력 오류를 수반
이를 해결하기 위한 방안으로 텍스트 스캔이 제시
스캐너로 문서를 읽어 이미지 데이터로 저장
문서 인식 프로그램을 통해 텍스트 데이터의 기본형태인 ASCII 코드로 변환
참고 : 문자인식 기술
문자 인식 기술의 역사
G.Tausheck(1928년): 패턴 정합방법
국내 경우
1970년대 초반부터 시작
1980년대이후 KIST, KAIST, 포항공대, 삼성, LG등
글눈 99(1999년) : 한글, 한자(1만 6천자), 영어, 일어, 독어, 일어, 불어 등 14개 국어 초당 300자씩 인식, 도표인식, 사진합성, 영상편집이 가능
아르미 : 한글, 한자(4천 8백자), 영어를 초당 300자 인식
문자 인식 기술의 분류
ON-LINE 인식방법
필기자가 전자 펜을 이용하여 직접 입력
서명인식, 필기문자 인식
OFF-LINE 인식방법
필기체 문서나 책 등의 인쇄된 문서 스캐너
ON-LINE 인식방법에 비해 어려운 기술이며
문서인식, 전표인식, 차량번호 인식, 지도 인식 등
문자 인식 응용기술
우편물 자동 분류 및 자동순로 구분기
배기가스 과다 배출차량 자동 단속기
버스 전용선 위반차량 자동 단속기, 과속 차량 자동 단속기 , 도난 범죄 차량 자동 단속기, 생산라인 불량품 자동 분별기
텍스트 파일 저장 방식
참고 자료
없음