Unicode変換

このツールでできること

Unicode変換ツールは、テキスト(日本語・英語・絵文字など)をUnicodeコードポイント(U+XXXX形式)に変換したり、コードポイントから元のテキストに戻したりできる無料オンラインツールです。4種類の出力形式(U+XXXX、\uXXXX、&#xXXXX;、0xXXXX)に対応し、文字コードの確認やプログラムのデバッグ、データ分析に役立ちます。サロゲートペアを含む絵文字やCJK拡張漢字も正しく処理します。

特徴

  • 4種類の出力形式 — U+XXXX(Unicode標準)、\uXXXX(JavaScript / Python)、&#xXXXX;(HTML数値文字参照)、0xXXXX(プログラミング全般)を切り替えられます。
  • サロゲートペア完全対応 — 絵文字やCJK統合漢字拡張Bなど、BMP外の文字(U+10000以上)もcodePointAtで正しく処理します。
  • 文字詳細テーブル — 変換結果と共に、各文字のコードポイント・10進数・UTF-8バイト数を一覧表示。デバッグに便利です。
  • ブラウザ完結・サーバー送信なし — 変換処理はすべてブラウザ内で完結。入力データが外部に送信されることはありません。
  • 登録・インストール不要 — ブラウザでアクセスするだけですぐに使えます。

使い方

  1. 上の「テキスト」欄に変換したい文字列を入力します。
  2. 出力形式(U+XXXX / \uXXXX / &#xXXXX; / 0xXXXX)をプルダウンから選びます。
  3. 「変換 ▼」ボタンを押すと、下の「Unicodeコードポイント」欄に変換結果が出力され、文字詳細テーブルも表示されます。
  4. 逆にコードポイントからテキストに戻したい場合は、下の欄にコードポイントを入力して「▲ 逆変換」ボタンを押します。どの形式でも自動認識されます。

Unicodeとは?

Unicodeは、世界中の文字を1つの文字コード体系で扱うための国際規格(ISO 10646)です。各文字には「コードポイント」と呼ばれる一意の番号(U+0000〜U+10FFFF)が割り当てられています。2024年9月リリースのUnicode 16.0では154,998文字が収録されています。

Unicodeの符号化方式(エンコーディング)にはUTF-8、UTF-16、UTF-32があります。Webでは UTF-8 が標準であり、ASCII互換かつ可変長(1〜4バイト)でデータ効率に優れています。JavaScriptの内部表現はUTF-16のため、BMP外の文字(絵文字など)はサロゲートペア(2つの16ビット値)で表現されます。

よく使うUnicode範囲

ブロック名範囲文字数説明
Basic LatinU+0000U+007F128ASCII文字(英数字・記号)。UTF-8で1バイト。
HiraganaU+3040U+309F96ひらがな(あ〜ん、濁点付き含む)。UTF-8で3バイト。
KatakanaU+30A0U+30FF96カタカナ(ア〜ン)。UTF-8で3バイト。
CJK Unified IdeographsU+4E00U+9FFF20,992漢字(日中韓統合)。UTF-8で3バイト。
EmojiU+1F600U+1F64F1,000+絵文字。BMP外のためUTF-16ではサロゲートペア。UTF-8で4バイト。

こんなときに使えます

  • 文字化けの原因調査 — 意図しない文字が表示されたとき、コードポイントを確認して正しい文字かどうかを判定できます。
  • 見た目が同じ文字の区別 — 全角・半角、ラテン文字とキリル文字など、見た目が似ている文字をコードポイントで正確に識別できます。
  • プログラムでのエスケープ — JavaScript(\uXXXX)やHTML(&#xXXXX;)で特殊文字をエスケープする際のコードポイントを取得できます。
  • 正規表現での文字範囲指定 — Unicode範囲を使った正規表現パターン(/[\u3040-\u309F]/)を構築する際にコードポイントを確認できます。
  • フォントの文字カバレッジ確認 — 特定のコードポイントの文字がフォントに含まれているかの確認に使えます。
  • データクレンジング — 制御文字やゼロ幅文字など、不可視の文字が紛れ込んでいないかコードポイントで確認できます。

よくある質問

無料で使えますか?
はい、完全無料です。回数制限・登録・ログインも一切ありません。
入力したデータはサーバーに送信されますか?
いいえ。変換処理はすべてお使いのブラウザ内(JavaScript)で処理されます。当サイトのサーバーにデータが送信されることはありません。
絵文字や特殊な漢字も変換できますか?
はい。BMP外の文字(U+10000以上)もサロゲートペアではなく正しいコードポイントで表示します。例えば「😀」は U+1F600 と変換されます。
逆変換でどの形式に対応していますか?
U+XXXX、\uXXXX、&#xXXXX;、0xXXXX の4形式を自動認識します。スペースやカンマで区切られた複数のコードポイントも一括で変換できます。
スマートフォンでも使えますか?
はい。レスポンシブ対応なので、iPhone・Android のブラウザからも利用できます。