计算字符数、字节数(UTF-8/ASCII)、单词数和行数。
字符串长度可以用不同的方式测量:字符数(视觉单位)、字节数(存储大小)、码点数(Unicode 单位)或字形群数(用户感知的字符)。在处理国际化文本、有大小限制的数据库或有字符限制的 API 时,理解这些区别至关重要。
字符数因编码而异:一个表情符号在视觉上可能是 1 个字符,但在 UTF-8 中是 4 个字节。单词计数通常按空格拆分。行数取决于换行符。字节数反映了实际存储大小,并随编码(UTF-8、UTF-16 等)而变化。
表情符号可以由多个 Unicode 码点组成。家庭表情符号可能是由零宽连结符连接的几个字符。不同的系统计数方式不同。
此工具使用 UTF-8,这是最常用的 Web 编码。UTF-8 每个字符使用 1-4 个字节:ASCII 使用 1 个字节,大多数其他语言使用 2-3 个字节,而表情符号使用 4 个字节。