String Length Calculator

Calcular el conteo de caracteres, bytes (UTF-8/ASCII), palabras y líneas.

Estado
Caracteres (Unicode) 0
Bytes (UTF-8) 0
Bytes (ASCII/Multi) 0
Palabras 0
Líneas 0
Espacios 0
Desglose de caracteres
ASCII: 0
No ASCII: 0
Dígitos: 0
¿Qué es la longitud de cadena?

La longitud de la cadena se puede medir de diferentes maneras: recuento de caracteres (unidades visuales), recuento de bytes (tamaño de almacenamiento), recuento de puntos de código (unidades Unicode) o recuento de grafemas (caracteres percibidos por el usuario). Comprender estas distinciones es crucial cuando se trabaja con texto internacional, bases de datos con límites de tamaño o APIs con restricciones de caracteres.

Métricas de longitud explicadas

El recuento de caracteres varía según la codificación: un emoji puede ser 1 carácter visualmente pero 4 bytes en UTF-8. El recuento de palabras suele dividirse por espacios en blanco. El recuento de líneas depende de los caracteres de nueva línea. El recuento de bytes refleja el tamaño de almacenamiento real y varía con la codificación (UTF-8, UTF-16, etc.).

Casos de uso comunes
  • Comprobación de la longitud del texto para los límites de Twitter/SMS
  • Validación de restricciones de campos de base de datos
  • Estimación del tiempo de lectura de artículos
  • Análisis de estadísticas de documentos
  • Estimación del tamaño de la carga útil de la API
Métricas proporcionadas
Caracteres (Unicode) Recuento total de caracteres, incluidos los espacios
Caracteres (Unicode) Recuento de caracteres excluyendo espacios en blanco
Palabras Recuento de palabras separadas por espacios
Líneas Número de saltos de línea + 1
Bytes Tamaño de bytes codificados en UTF-8
Preguntas Frecuentes

¿Por qué varía la longitud de los emojis?

Los emojis pueden estar compuestos por múltiples puntos de código Unicode. Un emoji de familia puede ser varios caracteres unidos por uniones de ancho cero (Zero-Width Joiners). Diferentes sistemas los cuentan de manera distinta.

¿Qué codificación se utiliza para el recuento de bytes?

Esta herramienta utiliza UTF-8, la codificación web más común. UTF-8 utiliza de 1 a 4 bytes por carácter: ASCII utiliza 1 byte, la mayoría de los demás idiomas utilizan de 2 a 3 bytes y los emojis utilizan 4 bytes.