Unicode转换器

将文本转换为Unicode转义序列,或反向转换。

字符 (Unicode)

Unicode 是编码、表示和处理文本的国际标准。它为每个写作系统中的每个字符,以及符号、表情符号和控制字符分配一个唯一的数字(码点)。Unicode 旨在成为通用字符集,目前包含超过 149,000 个字符,涵盖 161 种脚本。

Unicode 编码

Unicode 码点可以用不同的格式编码:UTF-8(可变 1-4 字节,兼容 ASCII)、UTF-16(2 或 4 字节,由 JavaScript/Windows 使用)和 UTF-32(固定 4 字节)。UTF-8 已成为 Web 上的主导编码,在保持对 ASCII 文本高效的同时处理所有语言。

常见使用场景
  • 调试文本中的编码问题
  • 查找特殊字符码点
  • 转换转义的 Unicode 序列
  • 分析字符组合
  • 处理国际化 (i18n)
支持的格式
U+XXXX 标准 Unicode 表示法(例如,'A' 为 U+0041)
\uXXXX JavaScript/JSON 转义序列
&#DDDD; HTML 十进制实体
&#xHHHH; HTML 十六进制实体
常见问题

UTF-8 和 Unicode 有什么区别?

Unicode 是字符集(字符到数字的映射)。UTF-8 是将这些数字编码为字节的一种方式。其他编码还包括 UTF-16 和 UTF-32。

为什么有些字符看起来像方块或问号?

这种情况发生在您的系统没有包含该字符的字体,或者编码被误检时。字符存在但无法显示。