문자 수, 바이트 수(UTF-8/ASCII), 단어 수, 줄 수를 계산합니다.
문자열 길이는 여러 방식으로 측정할 수 있습니다: 문자 수(시각적 단위), 바이트 수(저장 크기), 코드포인트 수(유니코드 단위), 그래핌 수(사용자가 인식하는 문자). 국제 텍스트, 크기 제한이 있는 데이터베이스, 문자 제한이 있는 API로 작업할 때 이러한 구분을 이해하는 것이 중요합니다.
문자 수는 인코딩에 따라 다릅니다: 이모지는 시각적으로 1문자이지만 UTF-8에서는 4바이트일 수 있습니다. 단어 수는 일반적으로 공백으로 분리됩니다. 줄 수는 개행 문자에 따라 다릅니다. 바이트 수는 실제 저장 크기를 반영하며 인코딩(UTF-8, UTF-16 등)에 따라 다릅니다.
이모지는 여러 유니코드 코드포인트로 구성될 수 있습니다. 가족 이모지는 Zero-Width Joiner로 결합된 여러 문자일 수 있습니다. 시스템마다 이를 다르게 계산합니다.
이 도구는 가장 일반적인 웹 인코딩인 UTF-8을 사용합니다. UTF-8은 문자당 1-4바이트를 사용합니다: ASCII는 1바이트, 대부분의 다른 언어는 2-3바이트, 이모지는 4바이트를 사용합니다.