स्ट्रिंग लंबाई कैलकुलेटर

वर्ण गणना, बाइट गणना (UTF-8/ASCII), शब्द गणना और लाइन गणना की गणना करें।

सांख्यिकी
वर्ण (यूनिकोड) 0
बाइट्स (UTF-8) 0
बाइट्स (ASCII/Multi) 0
शब्द 0
पंक्तियाँ 0
रिक्त स्थान 0
वर्ण (यूनिकोड)
ASCII: 0
गैर-ASCII: 0
अंक: 0
स्ट्रिंग लंबाई क्या है?

स्ट्रिंग की लंबाई को अलग-अलग तरीकों से मापा जा सकता है: वर्ण गणना (विज़ुअल इकाइयाँ), बाइट गणना (स्टोरेज आकार), कोडपॉइंट गणना (यूनिकोड इकाइयाँ), या ग्राफीम गणना (उपयोगकर्ता द्वारा समझे जाने वाले वर्ण)। अंतरराष्ट्रीय टेक्स्ट, आकार सीमा वाले डेटाबेस, या वर्ण प्रतिबंधों वाले API के साथ काम करते समय इन भेदों को समझना महत्वपूर्ण है।

लंबाई मेट्रिक्स की व्याख्या

एन्कोडिंग के आधार पर वर्ण गणना अलग-अलग होती है: एक इमोजी विज़ुअली 1 वर्ण हो सकता है लेकिन UTF-8 में 4 बाइट्स। शब्द गणना आमतौर पर व्हाइटस्पेस पर विभाजित होती है। लाइन गणना न्यूलाइन वर्णों पर निर्भर करती है। बाइट गणना वास्तविक स्टोरेज आकार को दर्शाती है और एन्कोडिंग (UTF-8, UTF-16, आदि) के साथ बदलती रहती है।

सामान्य प्रीसेट
  • Twitter/SMS सीमाओं के लिए टेक्स्ट की लंबाई की जाँच करना
  • डेटाबेस फ़ील्ड बाधाओं को मान्य करना
  • लेखों के लिए पढ़ने के समय का अनुमान लगाना
  • दस्तावेज़ आंकड़ों का विश्लेषण करना
  • API पेलोड आकार का अनुमान
प्रदान किए गए मेट्रिक्स
वर्ण (यूनिकोड) स्पेस सहित कुल वर्ण गणना
वर्ण (यूनिकोड) व्हाइटस्पेस को छोड़कर वर्ण गणना
शब्द स्पेस से अलग किए गए शब्दों की गणना
पंक्तियाँ लाइन ब्रेक की संख्या + 1
बाइट्स UTF-8 एन्कोडेड बाइट आकार
अक्सर पूछे जाने वाले प्रश्न

इमोजी की लंबाई अलग-अलग क्यों होती है?

इमोजी कई यूनिकोड कोडपॉइंट से बने हो सकते हैं। एक फैमिली इमोजी ज़ीरो-विड्थ जॉइनर्स द्वारा जुड़े कई वर्ण हो सकते हैं। अलग-अलग सिस्टम इन्हें अलग-अलग तरह से गिनते हैं।

बाइट गणना के लिए किस एन्कोडिंग का उपयोग किया जाता है?

यह टूल UTF-8 का उपयोग करता है, जो सबसे आम वेब एन्कोडिंग है। UTF-8 प्रति वर्ण 1-4 बाइट्स का उपयोग करता है: ASCII 1 बाइट का उपयोग करता है, अधिकांश अन्य भाषाएं 2-3 बाइट्स का उपयोग करती हैं, और इमोजी 4 बाइट्स का उपयोग करते हैं।