String Length Calculator

Calcular el conteo de caracteres, bytes (UTF-8/ASCII), palabras y líneas.

Cadena

Estado

Caracteres (Unicode) 0

Bytes (UTF-8) 0

Bytes (ASCII/Multi) 0

Palabras 0

Líneas 0

Espacios 0

Desglose de caracteres

ASCII: 0

No ASCII: 0

Dígitos: 0

¿Qué es la longitud de cadena?

La longitud de la cadena se puede medir de diferentes maneras: recuento de caracteres (unidades visuales), recuento de bytes (tamaño de almacenamiento), recuento de puntos de código (unidades Unicode) o recuento de grafemas (caracteres percibidos por el usuario). Comprender estas distinciones es crucial cuando se trabaja con texto internacional, bases de datos con límites de tamaño o APIs con restricciones de caracteres.

Métricas de longitud explicadas

El recuento de caracteres varía según la codificación: un emoji puede ser 1 carácter visualmente pero 4 bytes en UTF-8. El recuento de palabras suele dividirse por espacios en blanco. El recuento de líneas depende de los caracteres de nueva línea. El recuento de bytes refleja el tamaño de almacenamiento real y varía con la codificación (UTF-8, UTF-16, etc.).

Casos de uso comunes

Comprobación de la longitud del texto para los límites de Twitter/SMS
Validación de restricciones de campos de base de datos
Estimación del tiempo de lectura de artículos
Análisis de estadísticas de documentos
Estimación del tamaño de la carga útil de la API

Métricas proporcionadas

Caracteres (Unicode) Recuento total de caracteres, incluidos los espacios

Caracteres (Unicode) Recuento de caracteres excluyendo espacios en blanco

Palabras Recuento de palabras separadas por espacios

Líneas Número de saltos de línea + 1

Bytes Tamaño de bytes codificados en UTF-8

Preguntas Frecuentes

¿Por qué varía la longitud de los emojis?

Los emojis pueden estar compuestos por múltiples puntos de código Unicode. Un emoji de familia puede ser varios caracteres unidos por uniones de ancho cero (Zero-Width Joiners). Diferentes sistemas los cuentan de manera distinta.

¿Qué codificación se utiliza para el recuento de bytes?

Esta herramienta utiliza UTF-8, la codificación web más común. UTF-8 utiliza de 1 a 4 bytes por carácter: ASCII utiliza 1 byte, la mayoría de los demás idiomas utilizan de 2 a 3 bytes y los emojis utilizan 4 bytes.