Unicode変換
文字詳細
| 文字 | コードポイント | 10進数 | UTF-8 バイト数 |
|---|
このツールでできること
Unicode変換ツールは、テキスト(日本語・英語・絵文字など)をUnicodeコードポイント(U+XXXX形式)に変換したり、コードポイントから元のテキストに戻したりできる無料オンラインツールです。4種類の出力形式(U+XXXX、\uXXXX、&#xXXXX;、0xXXXX)に対応し、文字コードの確認やプログラムのデバッグ、データ分析に役立ちます。サロゲートペアを含む絵文字やCJK拡張漢字も正しく処理します。
特徴
- 4種類の出力形式 — U+XXXX(Unicode標準)、\uXXXX(JavaScript / Python)、&#xXXXX;(HTML数値文字参照)、0xXXXX(プログラミング全般)を切り替えられます。
- サロゲートペア完全対応 — 絵文字やCJK統合漢字拡張Bなど、BMP外の文字(U+10000以上)もcodePointAtで正しく処理します。
- 文字詳細テーブル — 変換結果と共に、各文字のコードポイント・10進数・UTF-8バイト数を一覧表示。デバッグに便利です。
- ブラウザ完結・サーバー送信なし — 変換処理はすべてブラウザ内で完結。入力データが外部に送信されることはありません。
- 登録・インストール不要 — ブラウザでアクセスするだけですぐに使えます。
使い方
- 上の「テキスト」欄に変換したい文字列を入力します。
- 出力形式(U+XXXX / \uXXXX / &#xXXXX; / 0xXXXX)をプルダウンから選びます。
- 「変換 ▼」ボタンを押すと、下の「Unicodeコードポイント」欄に変換結果が出力され、文字詳細テーブルも表示されます。
- 逆にコードポイントからテキストに戻したい場合は、下の欄にコードポイントを入力して「▲ 逆変換」ボタンを押します。どの形式でも自動認識されます。
Unicodeとは?
Unicodeは、世界中の文字を1つの文字コード体系で扱うための国際規格(ISO 10646)です。各文字には「コードポイント」と呼ばれる一意の番号(U+0000〜U+10FFFF)が割り当てられています。2024年9月リリースのUnicode 16.0では154,998文字が収録されています。
Unicodeの符号化方式(エンコーディング)にはUTF-8、UTF-16、UTF-32があります。Webでは UTF-8 が標準であり、ASCII互換かつ可変長(1〜4バイト)でデータ効率に優れています。JavaScriptの内部表現はUTF-16のため、BMP外の文字(絵文字など)はサロゲートペア(2つの16ビット値)で表現されます。
よく使うUnicode範囲
| ブロック名 | 範囲 | 文字数 | 説明 |
|---|---|---|---|
| Basic Latin | U+0000 – U+007F | 128 | ASCII文字(英数字・記号)。UTF-8で1バイト。 |
| Hiragana | U+3040 – U+309F | 96 | ひらがな(あ〜ん、濁点付き含む)。UTF-8で3バイト。 |
| Katakana | U+30A0 – U+30FF | 96 | カタカナ(ア〜ン)。UTF-8で3バイト。 |
| CJK Unified Ideographs | U+4E00 – U+9FFF | 20,992 | 漢字(日中韓統合)。UTF-8で3バイト。 |
| Emoji | U+1F600 – U+1F64F 他 | 1,000+ | 絵文字。BMP外のためUTF-16ではサロゲートペア。UTF-8で4バイト。 |
こんなときに使えます
- 文字化けの原因調査 — 意図しない文字が表示されたとき、コードポイントを確認して正しい文字かどうかを判定できます。
- 見た目が同じ文字の区別 — 全角・半角、ラテン文字とキリル文字など、見た目が似ている文字をコードポイントで正確に識別できます。
- プログラムでのエスケープ — JavaScript(\uXXXX)やHTML(&#xXXXX;)で特殊文字をエスケープする際のコードポイントを取得できます。
- 正規表現での文字範囲指定 — Unicode範囲を使った正規表現パターン(/[\u3040-\u309F]/)を構築する際にコードポイントを確認できます。
- フォントの文字カバレッジ確認 — 特定のコードポイントの文字がフォントに含まれているかの確認に使えます。
- データクレンジング — 制御文字やゼロ幅文字など、不可視の文字が紛れ込んでいないかコードポイントで確認できます。
よくある質問
- 無料で使えますか?
- はい、完全無料です。回数制限・登録・ログインも一切ありません。
- 入力したデータはサーバーに送信されますか?
- いいえ。変換処理はすべてお使いのブラウザ内(JavaScript)で処理されます。当サイトのサーバーにデータが送信されることはありません。
- 絵文字や特殊な漢字も変換できますか?
- はい。BMP外の文字(U+10000以上)もサロゲートペアではなく正しいコードポイントで表示します。例えば「😀」は
U+1F600と変換されます。 - 逆変換でどの形式に対応していますか?
- U+XXXX、\uXXXX、&#xXXXX;、0xXXXX の4形式を自動認識します。スペースやカンマで区切られた複数のコードポイントも一括で変換できます。
- スマートフォンでも使えますか?
- はい。レスポンシブ対応なので、iPhone・Android のブラウザからも利用できます。