文字列長さ計算

文字数、バイト数(UTF-8/ASCII)、単語数、行数を計算します。

ステータス
文字数(Unicode) 0
バイト(UTF-8) 0
バイト(ASCII/マルチバイト) 0
単語 0
0
スペース 0
文字内訳
ASCII: 0
非ASCII: 0
数字: 0
文字列の長さとは何ですか?

文字列の長さはさまざまな方法で測定できます:文字数(視覚的単位)、バイト数(ストレージサイズ)、コードポイント数(Unicode単位)、または書記素数(ユーザーが認識する文字)。これらの区別を理解することは、国際的なテキスト、サイズ制限のあるデータベース、または文字制限のあるAPIを扱う際に重要です。

長さの指標の説明

文字数はエンコーディングによって異なります。絵文字は視覚的には1文字ですが、UTF-8では4バイトです。単語数は通常空白で分割されます。行数は改行文字に依存します。バイト数は実際のストレージサイズを反映し、エンコーディング(UTF-8、UTF-16など)によって異なります。

主な使用例
  • Twitter/SMSの制限に対するテキスト長の確認
  • データベースフィールドの制約の検証
  • 記事の読了時間の推定
  • ドキュメント統計の分析
  • APIペイロードサイズの推定
提供される指標
文字数 スペースを含む総文字数
文字数(スペースなし) 空白を除いた文字数
単語 スペースで区切られた単語数
改行数 + 1
バイト UTF-8エンコードされたバイトサイズ
よくある質問

絵文字の長さが異なるのはなぜですか?

絵文字は複数のUnicodeコードポイントで構成されることがあります。家族の絵文字は、ゼロ幅接合子で結合された複数の文字かもしれません。異なるシステムはこれらを異なる方法でカウントします。

バイト数のカウントに使用されるエンコーディングは何ですか?

このツールは、最も一般的なウェブエンコーディングであるUTF-8を使用しています。UTF-8は1文字あたり1〜4バイトを使用します:ASCIIは1バイト、他のほとんどの言語は2〜3バイト、絵文字は4バイトを使用します。