写真から文字数カウント&文字起こし
画像をAIで文字起こし&文字数カウント。1日3回まで無料、上限後は端末内OCRに自動切替。
文字数
—
PNG, JPG, WebP, GIF対応
準備中...
写真・画像から文字起こし&文字数カウントが一度にできる無料ツール
「写真の文字数カウント」は、スマートフォンで撮影した写真、PCのスクリーンショット、スキャンした書類などの画像をアップロードすると、AI(Google Gemini)が画像内の文字を高精度に書き起こし、文字数・行数・読了時間・原稿用紙換算を同時に表示する無料サイトです。「写真から文字数をカウントしたい」「画像に写った文字を数えたい」「写真の文字をテキスト化したい」といった用途にそのまま使えます。AIモードは1日3回まで無料で、上限到達やエラー時は端末内で動く通常 OCR モードに自動でフォールバックします。AIに画像を送りたくないとき(社外秘・契約書・個人情報を含む写真など)は、最初から OCR モードを選べばブラウザ内だけで処理が完結し、外部送信ゼロでご利用いただけます。
主な機能
- AIモード(既定・推奨) — Google Gemini 2.5 Flash で画像内の文字を高精度に書き起こします。手書き・装飾フォント・低解像度・複雑な背景にも強く、印刷物なら 95% 以上の認識率が期待できます。画像は Cloudflare Pages Functions 経由で Gemini API に送信されます(詳細は外部送信ポリシー)。
- OCRモード(端末内・無制限) — Tesseract.js(軽量・初回のみ約12MB)または PaddleOCR(高精度・初回のみ約14MB)をブラウザ内で動かします。画像はサーバーに一切送信されず、社内資料・契約書・個人情報を含む写真でも安心して使えます。
- 自動フォールバック — AIモードの上限到達(429)、月予算超過(503)、その他のエラー時は、自動的に OCR モードに切り替えて結果を返します。ユーザーは何もしなくても、ほぼ確実に結果が得られます。
- 1日3回 + シェアで +5回 の無料枠 — AIモードは1日3回まで無料。X(旧Twitter)でこのツールをシェアすると、当日限定でさらに5回追加され、合計8回まで利用できます。それを超える分も OCRモードで無制限処理できます。
- 縦書き対応 — OCRモードの「詳細設定 → 縦書きとして認識する」をオンにすると、Tesseract の縦書き専用データ(jpn_vert、初回のみ約3MB)で縦書きの日本語を正しく認識します。書籍・看板・古典など。
- 文字数(改行・空白抜き)の自動カウント — 認識したテキストから改行とスペースを除いた純粋な文字数を表示。SNSやレポートの文字数制限と整合性を取りやすい数え方です。
- 読了時間・原稿用紙換算 — 読了時間(500文字/分目安)と400字詰め原稿用紙の枚数を自動算出。記事の長さや論文・レポートのボリューム把握に。
- 認識テキストの表示・コピー — 抽出したテキストはテキストエリアに表示され、選択してコピー可能。Word・Notion・メールにそのまま貼り付け。
- クライアントサイドの画像最適化 — AIモードでは送信前にブラウザ内で 1024px max にリサイズして通信量を削減。OCRモードでは内部で短辺1500px へのアップスケール・グレースケール変換・Otsu法による二値化・自動反転を実行して認識精度を向上。
使い方(3ステップ)
- ① 画像をアップロード — 「ファイルを選択」ボタンをクリックするか、画像ファイルを点線エリアにドラッグ&ドロップ。スマートフォンの場合はカメラで撮影した写真をそのまま選択できます。アップロード後、画像のプレビューが表示されます。
- ② 認識が自動実行 — 既定では AIモードが動き、3〜8 秒で結果が返ります。「画像を最適化中... → AIで文字を認識中... → 結果を整形中...」と段階表示されます。AIモードが使えない場合は自動的に OCRモードに切り替わります(明示的に「詳細設定 → OCRモード」を選んでも切替可能)。
- ③ 文字数・抽出テキストを確認 — 文字数(改行・空白抜き)・行数・読了時間・原稿用紙換算が画面に表示されます。テキストエリアには認識されたテキストが表示され、選択してコピーできます。
こんなときに使えます
- SNS投稿用の画像の文字数チェック — Instagram・X(旧Twitter)・LINE などに投稿する画像内のテキスト文字数を、投稿前にAIで素早く確認。SNS 画像内テキストの文字数ベストプラクティスもどうぞ。
- 紙のメモ・板書・ホワイトボードの文字起こし — 会議のホワイトボード、授業の板書、手書きメモを撮影した写真からテキストを抽出して、議事録や資料へ転記したいとき。手書きは AIモードが圧倒的に有利です。
- スキャンした書類・紙の原稿の文字数把握 — スキャンしたレポートや原稿の文字数を確認したいとき。原稿用紙換算も同時表示されるので、論文・小説の字数管理に便利。
- 名刺・看板・パンフレットのテキスト抽出 — 撮影した名刺やお店の看板、パンフレットの文字を素早くテキスト化して、検索や転記に。
- スクリーンショットからのコピペ — テキストとして選択できないアプリ画面・ゲーム画面・PDF表示などのスクリーンショットから文字を抽出。
- 機密書類のテキスト化 — 契約書・社外秘・個人情報を含む書類は「OCRモード」を選択すれば端末内だけで処理が完結し、外部送信ゼロ。
- 翻訳前の下準備 — 外国語の写真(メニュー・標識・本のページなど)からテキストを抽出して、翻訳ツールに貼り付け。
- レポート・論文の引用準備 — 紙の書籍や雑誌から引用する文章をテキスト化して、文字数や引用範囲を確認。
OCR精度を上げる撮影・画像のコツ
認識精度は元画像の品質に大きく左右されます。AIモードは画像品質が悪くてもある程度補正できますが、撮影時に少し気をつけるだけで結果が大きく変わります。詳細は OCR 精度を最大化する撮影・前処理テクニックをご覧ください。
- 明るく均一な照明で撮影する — 暗い場所や、紙の一部だけ影になっている状態だと文字が背景と混ざって認識しにくくなります。窓際の自然光や、スタンドライトで全体を明るく照らした状態がベストです。
- 正面・水平に構えて撮る — 斜めから撮影した文字は歪んで認識精度が下がります。スマホは紙と平行に構え、画面のグリッド表示を使って水平を取りましょう。
- ピントを合わせる — 撮影時に文字部分をタップしてピントを合わせると、輪郭がくっきりして認識が安定します。
- 文字部分を画面いっぱいに写す — 文字が小さく写っていると解像度不足で認識できません。文字部分を画面の大部分に収めるように寄って撮るか、撮影後にトリミングしてください。
- 背景はシンプルに — 紙の周りに別の物が映り込んでいると、その文字や模様が誤認識される場合があります。可能ならば文字部分だけを切り抜いてからアップロードしてください。
- スクリーンショットは等倍で — PCのスクリーンショットは撮影時の画面解像度のまま保存するのがおすすめです。SNSなどに一度アップロードして再ダウンロードした画像は、再圧縮で文字がぼやけて精度が落ちます。
計算の考え方
文字数(改行・空白抜き)は、OCRで認識したテキストから半角・全角スペース、タブ、改行を取り除いた、実際の文字・数字・記号の数です。SNSや原稿の文字数制限と同じ基準で数えています。読了時間は「文字数 ÷ 500」で算出しています。一般的な成人の黙読速度がおおよそ分速400〜600文字とされるため、500文字/分を目安として採用しています。原稿用紙の枚数は「文字数 ÷ 400」(端数切り上げ)で計算しており、400字詰め原稿用紙1枚あたりの字数に換算しています。行数は認識テキストに含まれる改行の数+1で算出しています。OCRの認識結果に基づくため、原画像の改行とは異なる場合があります。
プライバシーとデータの扱い
本ツールは利用シナリオに応じて2つのモードを選択でき、画像の扱いが大きく異なります。
- AIモード(既定) — 画像は Cloudflare Pages Functions のプロキシ経由で Google Gemini API に送信され、認識結果のテキストが返されます。レート制限のため IPアドレスはハッシュ化して24時間保持されます(個人を特定できない短縮ハッシュ)。詳細は外部送信ポリシーを参照。社外秘や契約書を含む画像はこのモードでは扱わないでください。
- OCRモード(端末内) — Tesseract.js または PaddleOCR を WebAssembly / ONNX Runtime Web でブラウザ内に読み込み、すべての文字認識処理を端末上で実行します。アップロードした画像も、認識されたテキストも、サーバーや外部サービスには一切送信されません。OCRエンジン本体・日本語モデル(Tesseract 12MB、PaddleOCR 14MB、jpn_vert 3MB)は初回利用時にCDNから読み込まれますが、これらは画像データを含まない汎用ライブラリのダウンロードで、ユーザーのコンテンツが外部に送信されることはありません。PaddleOCR モデルはユーザーが明示的にボタンをタップしたときだけ確認モーダルを経てダウンロードされます。
AIモードとOCRモードの使い分け
- AIモード(Gemini) — 一般文書、手書きメモ、装飾フォント、低解像度のスクショなど「難しい画像」に。文脈推論で崩した文字も読めます。1日3回まで無料(シェアで+5回)。画像は Google に送信されます。
- OCRモード(Tesseract、通常) — スキャンした印刷物、PCの鮮明なスクショなど「標準的な画像」に。軽量で動作が速く、端末内完結。初回のみ12MBの言語データを読み込み。
- OCRモード(PaddleOCR、高精度) — Tesseract で物足りないが端末内完結を維持したいときに。日本語専用モデルで印刷物・写真にもう一段強い。初回のみ14MBのモデルを確認モーダル経由でダウンロード。
既定は AIモードです。切替は「詳細設定 → 認識モード」から。OCRモードを選ぶと、その下に「縦書き設定」と「OCRエンジン設定」が展開されます。画像から文字起こしを無料でやる方法でシーン別の使い分けを詳しく解説しています。
関連ツール
画像ではなく直接テキストを貼り付けて文字数をカウントしたい場合は「文字数カウント」をご利用ください。改行・空白の扱いやバイト数表示など、より詳細な指標を確認できます。文章の単語数だけを数えたい場合は「単語数カウント」、画像のリサイズ・形式変換は「画像コンバーター」、画像にモザイクをかけたい場合は「画像モザイク」もご活用ください。
よくある質問(FAQ)
- 無料で使えますか?
- はい、完全無料です。会員登録やログインは不要で、ブラウザを開けばすぐにご利用いただけます。AIモードは API コスト管理のため 1日3回まで、X(旧Twitter)でシェアすると当日限定でさらに5回追加されて合計8回まで使えます。OCRモード(端末内 Tesseract / PaddleOCR)は完全無制限です。
- アップロードした画像はサーバーに送信されますか?
- 既定の「AIモード」では、画像が Cloudflare Pages Functions 経由で Google Gemini API に送信されます。送信内容・利用目的の詳細は外部送信ポリシーをご覧ください。「OCRモード」を選択すれば、画像はお使いの端末(ブラウザ)内だけで処理され、当サイトのサーバーや外部サービスには一切送信されません。社外秘・契約書・個人情報を含む写真は OCRモードでご利用ください。
- AIモードとOCRモード、どちらが正確ですか?
- 一般的には AIモード(Gemini)の方が高精度です。特に手書き・低解像度・装飾フォント・歪んだ画像で差が大きく出ます。一方、印刷物をきれいにスキャンした書類なら OCRモード(PaddleOCR 高精度)も AIに肩を並べる精度を出せます。「まず AIモードで試して、結果が悪ければ OCRモードに切り替えて再試行」が現実的なワークフローです。
- AIモードがエラーになったり遅いです
- AIモードはネットワーク経由で外部APIを呼び出すため、3〜8秒程度かかります。1日3回の上限を超えた場合・サイト全体の月予算上限に達した場合・API側の一時障害が発生した場合は自動的に OCRモードにフォールバックして処理を完了します。「AIモードに失敗しました。通常モードで処理します」のトーストが出たら、結果自体は OCRモード経由で返っています。
- どんな画像形式に対応していますか?
- PNG / JPEG(JPG)/ WebP / GIF に対応しています。AIモードでは送信前にブラウザ内で 1024px max の JPEG にリサイズします。HEIC(iPhone標準形式)は事前に JPEG/PNG に変換してからアップロードしてください。
- 日本語の手書き文字は認識できますか?
- 手書きは AIモードが圧倒的に有利です。ボールペンで書いた走り書き程度なら Gemini が高精度で読み取ります。崩した行書や続け字は AIでも難しいので、撮影時は「ブロック体ではっきり書く」「明るい場所で正面から撮影」を心がけてください。OCRモード(Tesseract / PaddleOCR)は印刷物前提で、手書きはほぼ読めません。
- 認識精度が低いときはどうすればよいですか?
- ①明るい場所で撮影する、②正面から傾きが少ない角度で撮る、③文字部分が画像全体に大きく写るようトリミング、④ピントが合っていることを確認、の4点で大きく改善します。それでも精度が出ないときは「AIモード ↔ OCRモード」を切り替えると、片方が読めるケースもあります。詳しくはOCR 精度を最大化する撮影・前処理テクニックを参照。
- 縦書きの文字は認識できますか?
- はい。「詳細設定 → OCRモード → 縦書きとして認識する」をオンにすると、Tesseract の縦書き専用言語データ(jpn_vert、初回のみ約3MB追加ダウンロード)で認識します。AIモードでも縦書きはある程度読めますが、長文だと行順がたまに崩れるため、長い縦書きは OCRモード(縦書きON)が安定します。
- PDFファイルから文字数をカウントできますか?
- 直接PDFはアップロードできませんが、PDFを画像(JPEG / PNG)として書き出してからアップロードすれば認識できます。Mac の「プレビュー」、Windows の「Snipping Tool」、各種PDF閲覧ソフトのスクリーンショット機能などをご利用ください。詳しい手順は画像から文字起こしを無料でやる方法を参照。
- スマートフォンでも使えますか?
- はい、スマートフォン・タブレットのブラウザでもご利用いただけます。撮影したばかりの写真をその場でアップロードして文字数をカウントできます。
- 文字数の数え方は他の文字数カウントツールと同じですか?
- はい。当サイトの「文字数カウント」と同じ「改行・空白を抜いた文字数」をメイン指標として表示しています。読了時間(500文字/分目安)・400字詰め原稿用紙換算も同じ計算式です。
- 使われているAI・OCRエンジンは何ですか?
- AIモードは Google の Gemini 2.5 Flash(マルチモーダルAI)。OCRモードはオープンソースの Tesseract.js(v5、通常)と PaddleOCR(PP-OCRv4検出モデル + PP-OCRv3日本語認識モデル、高精度)。OCRモードは WebAssembly / ONNX Runtime Web でブラウザ内で動作し、外部APIへの送信は一切発生しません。
- 機密情報を含む書類でも使えますか?
- 「OCRモード」を選択してください。画像はブラウザ内(お使いの端末のメモリ上)だけで処理され、当サイトのサーバーや Google などの外部にも一切送信されません。社内資料・契約書・個人情報・未公開原稿などにご利用いただけます。「AIモード」は画像が Google Gemini に送信されるため、社外秘の用途には適しません。
- シェアして +5回もらった枠は翌日も残りますか?
- いいえ、シェアによるボーナス枠は当日限定です。日付が変わると(UTC 0時)通常の3回枠にリセットされ、ボーナスを得るには再度シェアが必要です。同じ日に複数回シェアしても、ボーナスは合計+5回までです。