유니코드 변환기

텍스트를 유니코드 이스케이프 시퀀스로 변환하거나 그 반대로 변환합니다.

입력

출력

유니코드란 무엇인가요?

유니코드는 텍스트를 인코딩, 표현, 처리하기 위한 국제 표준입니다. 모든 문자 체계의 모든 문자와 기호, 이모지, 제어 문자에 고유 번호(코드포인트)를 할당합니다. 유니코드는 범용 문자 집합을 목표로 하며, 현재 161개 스크립트를 다루는 149,000개 이상의 문자를 포함합니다.

유니코드 인코딩

유니코드 코드포인트는 다양한 형식으로 인코딩될 수 있습니다: UTF-8(가변 1-4바이트, ASCII 호환), UTF-16(2 또는 4바이트, JavaScript/Windows에서 사용), UTF-32(고정 4바이트). UTF-8은 웹에서 지배적인 인코딩이 되었으며, 모든 언어를 처리하면서 ASCII 텍스트에 효율적입니다.

주요 사용 사례

텍스트 인코딩 문제 디버깅
특수 문자 코드포인트 찾기
이스케이프된 유니코드 시퀀스 변환
문자 구성 분석
국제화(i18n) 작업

표기 형식

U+XXXX 표준 유니코드 표기법 (예: 'A'는 U+0041)

\uXXXX JavaScript/JSON 이스케이프 시퀀스

&#DDDD; HTML 10진수 엔티티

&#xHHHH; HTML 16진수 엔티티

자주 묻는 질문

UTF-8과 유니코드의 차이점은 무엇인가요?

유니코드는 문자 집합(문자를 숫자에 매핑)입니다. UTF-8은 그 숫자를 바이트로 인코딩하는 한 가지 방법입니다. 다른 인코딩으로는 UTF-16과 UTF-32가 있습니다.

왜 일부 문자가 상자나 물음표로 보이나요?

시스템에 해당 문자를 포함하는 글꼴이 없거나 인코딩이 잘못 감지될 때 발생합니다. 문자는 존재하지만 표시할 수 없습니다.