टेक्स्ट को यूनिकोड एस्केप सीक्वेंस में या इसके विपरीत बदलें।
यूनिकोड टेक्स्ट को एन्कोड करने, प्रदर्शित करने और संभालने के लिए एक अंतरराष्ट्रीय मानक है। यह प्रत्येक लेखन प्रणाली के प्रत्येक वर्ण के साथ-साथ प्रतीकों, इमोजी और नियंत्रण वर्णों को एक अद्वितीय संख्या (कोडपॉइंट) प्रदान करता है। यूनिकोड का लक्ष्य सार्वभौमिक वर्ण सेट बनना है, जिसमें वर्तमान में 161 लिपियों को कवर करने वाले 149,000 से अधिक वर्ण शामिल हैं।
यूनिकोड कोडपॉइंट को विभिन्न प्रारूपों में एन्कोड किया जा सकता है: UTF-8 (परिवर्तनीय 1-4 बाइट्स, ASCII-संगत), UTF-16 (2 या 4 बाइट्स, JavaScript/Windows द्वारा उपयोग किया जाता है), और UTF-32 (निश्चित 4 बाइट्स)। UTF-8 वेब पर प्रमुख एन्कोडिंग बन गया है, जो ASCII टेक्स्ट के लिए कुशल रहते हुए सभी भाषाओं को संभालता है।
यूनिकोड वर्ण सेट (वर्णों का संख्याओं से मिलान) है। UTF-8 उन संख्याओं को बाइट्स के रूप में एन्कोड करने का एक तरीका है। अन्य एन्कोडिंग में UTF-16 और UTF-32 शामिल हैं।
ऐसा तब होता है जब आपके सिस्टम में ऐसा फ़ॉन्ट नहीं होता जिसमें वह वर्ण शामिल हो, या जब एन्कोडिंग गलत तरीके से पहचानी जाती है। वर्ण मौजूद है लेकिन प्रदर्शित नहीं किया जा सकता।