텍스트를 유니코드 이스케이프 시퀀스로 변환하거나 그 반대로 변환합니다.
유니코드는 텍스트를 인코딩, 표현, 처리하기 위한 국제 표준입니다. 모든 문자 체계의 모든 문자와 기호, 이모지, 제어 문자에 고유 번호(코드포인트)를 할당합니다. 유니코드는 범용 문자 집합을 목표로 하며, 현재 161개 스크립트를 다루는 149,000개 이상의 문자를 포함합니다.
유니코드 코드포인트는 다양한 형식으로 인코딩될 수 있습니다: UTF-8(가변 1-4바이트, ASCII 호환), UTF-16(2 또는 4바이트, JavaScript/Windows에서 사용), UTF-32(고정 4바이트). UTF-8은 웹에서 지배적인 인코딩이 되었으며, 모든 언어를 처리하면서 ASCII 텍스트에 효율적입니다.
유니코드는 문자 집합(문자를 숫자에 매핑)입니다. UTF-8은 그 숫자를 바이트로 인코딩하는 한 가지 방법입니다. 다른 인코딩으로는 UTF-16과 UTF-32가 있습니다.
시스템에 해당 문자를 포함하는 글꼴이 없거나 인코딩이 잘못 감지될 때 발생합니다. 문자는 존재하지만 표시할 수 없습니다.