Unicode Info

テキストフィールドに入力された文字列を、codePointごとに表示します。「𦿶(なぎ)」のような補助漢字を入力すると、Javaでは"\uD85B\uDFF6"のようにchar 2文字で表現されます。また、「が」のように濁点のついた文字を入力すると、正規分解によってchar 2文字でも表現可能なことがわかります。1 char != 1 code point != 1文字。いろいろ入力して試してみてください。
また、U+0000や、\u0000といったエスケープされた入力にも対応しています。

  • サロゲートペア
    • 「なぎ」=U+26FF6
  • 結合文字 
    • 「が」の表記方法二種類=U+304bU+3099 U+304C 
  • 異体字セレクタ 
    • 「葛」の異体字二種類=U+845BU+E0100 U+845BU+E0101
  • 上下にはみだす顔文字
    • o͡͡͡͡͡͡͡͡͡͡͡͡͡͡╮(´°̥̥̥̥̥̥̥̥ω°̥̥̥̥̥̥̥̥`)╭o͡͡͡͡͡͡͡͡͡͡͡͡͡͡
  • 絵文字
    • ☀ 😄 1⃣ (U+2600 U+1F604 U+31U+20E3)
  • Normalizer
    • ㌶ NFKDで「ヘクタール」に正規化されます。