2011/06/10

ユニコードの文字コードを調べる(国際化ドメイン名)

下記のURLの違いわかりますか?
素朴な疑問 http://example.com  http://еxample.com って表示がわかれるのかな?」

下記ページにコピーしてみると、実際のUnicodeでの表記がわかります。

最初のURLはよく使われるサンプル。
二番目のものはe(U+65)をキリル文字のе(U+435)に置換したものです。このような非ASCII文字を使ったドメイン名は国際化ドメイン名と呼ばれており、内部ではpunycodeと呼ばれるエンコードが行われています。
http://еxample.com -> http://xn--xample-2of.com/

迷惑メール等に含まれるURLはこのような偽装がされている可能性もあるため、原則として怪しいメールのリンクはクリックしない方が良いと思います。

2011/6/10時点で確認した範囲では、facebook、twitterはそのままURLを表示しますが、iphone上のTwitterアプリはpunycodeでの表示を行っていました。

0 件のコメント:

コメントを投稿