용어집

UTF(Unicode Transformation Format)

작성자
관리자
작성일
2022-06-21 10:18
조회
596
UTF(Unicode Transformation Format)은 유니코드 문자 인코딩 방식을 의미한다.

여기서 유니코드(Unicode)란 전 세계의 모든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도록 설계된 산업 표준이며, 유니코드 협회(Unicode Consortium)가 제정한다.

유니코드의 목적은 현존하는 문자 인코딩 방법들을 모두 유니코드로 교체하려는 것이다.
기존의 인코딩들은 그 규모나 범위 면에서 한정되어 있고, 다국어 환경에서는 서로 호환되지 않는 문제점이 있었다.
유니코드는 컴퓨터 소프트웨어의 국제화와 지역화에 널리 사용되며, 비교적 최근의 기술인 XML, 자바, 그리고 최신 운영 체제 등에서도 지원하고 있다.

UTF의 종류에는 UTF-8, UTF-16, UTF-32, UTF-EBCDIC 등이 존재한다.

UTF-8을 살펴보면, UTF-8 인코딩은 유니코드 한 문자를 8비트로 인코딩하여 1바이트에서 4바이트까지를 사용한다.
예를 들어서, U+0000부터 U+007F 범위에 있는 ASCII 문자들은 UTF-8에서 1바이트만으로 표시된다. 4바이트로 표현되는 문자는 모두 기본 다국어 평면(BMP) 바깥의 유니코드 문자이며, 거의 사용되지 않는다.

top