音声文字起こし・AI要約
マイクで話した内容をリアルタイムでテキスト化し、そのままAIで要約まで一気通貫。会議メモから議事録の下書き、講義・インタビュー・動画字幕の作成まで、登録不要・ブラウザだけで完結します。
※ Chrome 内蔵の Gemini Nano(Google 製・端末上で動作するオンデバイス AI)を使用します。初回のみ約 1.5〜3 GB のダウンロードが必要で、容量・回線速度によってはダウンロードに数分〜数十分かかります。完了後はオフラインでも要約できます。
要約
このツールでできること
音声文字起こし・AI要約ツールは、パソコンやスマートフォンのマイクから話した内容を、ブラウザがリアルタイムでテキスト化し、そのまま AI が要約まで仕上げる無料の文字起こしツールです。日本語と英語に対応しており、録音→認識→要約の流れがブラウザだけで完結するので、会議メモを議事録の下書きにしたり、講義の書き起こしを要点リストにまとめたり、長いインタビューの一次原稿から記事サマリを作ったりといった作業を、ワンタッチで進められます。登録もインストールも、外部 AI サービスの API キーも不要です。
主な機能
- リアルタイム文字起こし — マイクから話した内容を、Web Speech API を使ってその場でテキスト化します。日本語・英語(米英)に対応し、認識中の途中結果と確定結果を別々に表示します。
- AI 要約(議事録の下書きに) — 文字起こしテキストを、お使いのブラウザに搭載された AI(Chrome の Summarizer API:Gemini Nano)でブラウザ内だけで要約します。会議の決定事項・論点・結論の整理がワンクリック。AI が利用できない環境では、文の重要度を計算する簡易要約(重要文抽出)に自動フォールバックします。
- 外部AIサービスへの登録不要 — ChatGPT・Gemini・Claude などのアカウントや API キー、課金は一切不要。お使いのブラウザに既に入っている AI を直接呼び出します。
- 自動再開 — Web Speech API は無音状態が続くと自動で停止する仕様がありますが、本ツールでは録音中に停止しても自動的に再開し、長時間の文字起こしでも途切れにくくしています。
- 編集可能なテキストエリア — 認識結果をその場で修正・追記できます。誤認識した箇所や固有名詞をすぐに直せます。修正してから要約すると、より精度の高いサマリが得られます。
- 自動保存 — 入力内容はお使いの端末(ブラウザの LocalStorage)に自動保存されるので、ページを閉じても内容が残ります。
- コピー・ダウンロード — 文字起こし結果も要約も、ワンクリックでクリップボードへコピー、または .txt ファイルとしてダウンロードできます。
- テキストの貼り付け要約にも対応 — マイクを使わずに、既にあるメモ・原稿・長文メールをテキストエリアに貼り付けて要約だけ使うこともできます。
- プライバシー配慮 — 文字起こし結果と要約は当サイトのサーバーには一切送信・保存されません。
AI 要約の使い方と特徴
本ツールの AI 要約は、ブラウザに搭載されたオンデバイス AI(Chrome の Summarizer API:内部モデルは Gemini Nano)を呼び出して動作します。OpenAI や Anthropic などの外部 API を利用しないため、API キー登録・課金・利用回数制限は一切ありません。録音した会議内容や貼り付けた長文をテキストエリアに用意し、「要約する」ボタンを押すだけで、要点が箇条書きや短い段落に整理されます。要約結果のバッジに「AI 要約」と表示されていれば AI モデルが、「簡易要約(重要文抽出)」と表示されていれば、文の重要度を算出して上位の文を抜き出すフォールバック方式が動いています。どちらの方式でもデータがブラウザの外に送信されることはありません。
初回のみ AI モデルのダウンロード(数百MB〜数GB)が必要です。ダウンロードが必要な状態のとき、要約ボタンを押すと「AIモデルのダウンロードが必要です。続けますか?」という確認ダイアログが表示されます。「OK」を押すとダウンロードが始まり、要約ブロックに進捗(%)がリアルタイムで表示されます。「キャンセル」を押した場合は、その場で簡易要約(重要文抽出)にフォールバックします。一度ダウンロードが完了すれば、次回以降は確認ダイアログなしで即座に要約が走ります。
AI 要約を使った議事録作成の典型ワークフローは次のとおりです。1) 会議中に「録音を開始」ボタンで文字起こしを走らせる。2) 終了後、誤認識を編集して整える。3) 「要約する」ボタンで要点を生成し、決定事項・課題・宿題を抜き出す。4) 議事録テンプレートに貼り付けて、参加者・日時・タイトルを補えば完成。これだけで議事録作成の所要時間を大幅に短縮できます。
こんなときに使えます
会議や打ち合わせで「メモを取りながら聞くのが大変」と感じる場面で、録音ボタンを押すだけで会話をテキスト化し、AI 要約で議事録の下書きまで作れます。大学の講義やオンライン授業で板書だけでは追いつかないとき、後から見直すための文字起こしとしても便利です。インタビュー・取材の書き起こしの一次原稿、YouTube や Voicy・Podcast 配信の字幕や台本起こし、英語スピーチ・スピーキング練習のセルフチェック、英会話レッスンの復習など、音声をテキストにしたいあらゆる場面で活躍します。
- 会議メモ・議事録の下書き — 会議中に録音、AI 要約で決定事項・宿題を整理。営業の商談メモにも。
- 1on1・面談・キャリア相談の振り返り — 自分の発言を後から要約し、合意事項やネクストアクションを言語化。
- 講義・授業・セミナーの文字起こし — オンライン授業や録画ウェビナーの音声をテキスト化+要約してノート代わりに。
- インタビュー・取材の一次原稿 — 1 時間超えの取材も、要約で「記事の見出し候補」をすぐに作れます。
- YouTube・Voicy・Podcast の字幕と概要欄 — 字幕の下書き+AI 要約で配信概要欄の文章まで。
- 長いメール・記事原稿の要点抽出 — マイクを使わず、テキストを貼り付けて要約だけ使うことも可能。
- アイデアメモ・口述筆記 — 散歩中・運転前後などキーボードを打てない場面で、思いついた内容をテキスト化。
- 英語の発音・スピーキング練習 — 認識結果が想定と一致するかでセルフチェック。
他の文字起こしサービスとの違い
Notta・Rimo Voice・Otter.ai などの専用サービスは、複数話者の自動分離・タイムコード付き字幕・チーム共有といった高機能を持ちますが、いずれもアカウント登録が必須で、無料枠には録音時間・月あたりの利用回数といった制限があります。本ツールは、登録不要・録音時間無制限・回数無制限・完全無料という割り切った設計で、「ちょっとした文字起こしと要約をその場で済ませたい」というニーズに特化しています。話者分離や正確なタイムコードが必要な業務(裁判記録・公式議事録など)では専用サービスを、日常の会議メモや勉強用には本ツールを、と使い分けるのがおすすめです。AI 要約も、外部 AI サービスのチャット欄に長文を貼り付ける手間や、文字数制限・API 課金を気にせず使えるのが本ツールの強みです。
仕組みと注意点
本ツールはブラウザに標準搭載されている Web Speech API(音声認識 API)と、Chrome に搭載された Summarizer API(Gemini Nano モデル)を組み合わせて動作します。マイクから取り込んだ音声は、ブラウザを介して音声認識エンジン(Chrome の場合は Google の認識サーバー)へ送られ、テキストに変換された結果がブラウザに返されます。文字起こし後の AI 要約は、ブラウザにダウンロード済みのオンデバイス AI モデルが処理するため、テキストがブラウザの外に出ることはありません。極めて機密性の高い内容(個人情報・社外秘の議論など)を扱う場合は、音声認識自体もオフラインで処理する有償の専用サービスのご利用をおすすめします。Web Speech API は Google Chrome・Microsoft Edge・Safari で利用でき、AI 要約は Chrome 138 以降の対応端末で利用可能です。Firefox は現状 Web Speech API に対応していないためご利用いただけません。
AIモデル(Gemini Nano)が入っているか確認する方法
本ツール画面上部の「AIモデル: 利用可能(DL済み)」表示でも判別できますが、Chrome の管理画面から直接確認することもできます。次のアドレスを Chrome のアドレスバーに直接コピー&ペーストして開いてください(このページからのリンククリックではブラウザの仕様上開けません)。
chrome://components/— モデルのバージョン管理画面。「Optimization Guide On Device Model」の項目を探してください。バージョン番号(例:2024.6.5.2205)が表示されていればモデルは取得済み、0.0.0.0や空欄なら未取得です。「アップデートを確認」ボタンで最新版に更新できます。chrome://on-device-internals/— オンデバイス AI のデバッグ画面。モデルの状態・パフォーマンス指標・クラッシュ履歴などの詳細が確認できます。リセット用のボタンも提供されています。chrome://flags— 「Optimization Guide On Device Model」フラグの有効/無効切替。「Enabled BypassPerfRequirement」にすると低スペック端末でも動作を試せます。
Gemini Nano や Chrome 内蔵 AI の仕様について詳しくは、Chrome Built-in AI 公式ドキュメントおよび Summarizer API のドキュメントをご参照ください。
詳しい使い方
- 言語を選びます(デフォルトは日本語)。会話の言語に合わせて切り替えてください。
- 「録音を開始」ボタンを押し、ブラウザのマイク許可ダイアログで「許可」を選びます(初回のみ)。
- マイクに向かって話すと、リアルタイムでテキストエリアに文字起こし結果が表示されます。途中の認識結果(薄いグレーの文字)は、確定すると黒い文字に変わります。
- 停止したいときはもう一度録音ボタンを押します。テキストはそのまま残り、ブラウザを閉じても自動保存されています。
- 誤認識や固有名詞の修正は、テキストエリアで直接編集できます。
- 「要約する」ボタンを押すと、テキスト全体を AI が要約します。要約結果は元のテキストと別ブロックに表示されます。
- 「コピー」「ダウンロード」で結果を取り出し、議事録・記事原稿・字幕などにご利用ください。要約だけのコピー・新規要約のやり直しもできます。
認識精度を上げるコツ
Web Speech API の認識精度は、マイクの品質と周囲の騒音に大きく左右されます。静かな部屋で、マイクから 30cm 程度の距離ではっきり話すと精度が上がります。ノートパソコン内蔵マイクよりも、USB マイクやヘッドセット型マイクの方が誤認識が少ない傾向があります。会議録音などで複数人の発言を文字起こしする場合は、できるだけ会議用マイクや指向性のあるマイクを使うのがおすすめです。専門用語や固有名詞、社内用語などは誤認識されやすいため、文字起こし後にテキストエリアで修正してから要約すると、より精度の高いサマリが得られます。
議事録の下書きを早く作るコツ
議事録の作成時間を短縮するには、録音中から「決定」「宿題」「次回」などのキーワードを口頭で挟んでおくと、後から検索や AI 要約での重要文抽出がしやすくなります。会議の冒頭で「今日のアジェンダは 3 つ」と宣言しておくと、AI 要約でも構造を捉えやすくなる傾向があります。要約結果は完成形ではなくたたき台として扱い、参加者・日時・場所などのメタ情報は別途補完してください。長時間の会議は途中で一度ダウンロードしておくと安心です。
よくある質問
- 無料で使えますか?
- はい、完全無料です。登録やログイン、アプリのインストールは不要で、ページを開けばすぐに使えます。文字数や録音時間の上限もありません。
- AI要約はどうやって動いていますか?
- お使いのブラウザに搭載された AI 要約機能(Chrome の Summarizer API:Gemini Nano)が利用可能な場合は、それを使ってブラウザ内で要約します。AI モデルが利用できない環境では、文の重要度を計算して上位の文を抜き出す簡易要約(重要文抽出)に自動フォールバックします。どちらもブラウザ内だけで完結し、当サイトのサーバーに送信されることはありません。
- AIモデルのダウンロードはいつ・どれくらい行われますか?
- 初回利用時のみ、Chrome の Summarizer API が AI モデル(Gemini Nano、約 1.5〜3 GB)のダウンロードを必要とします。本ツールでは「要約する」ボタンを押した際、ダウンロードが必要な状態であれば確認ダイアログを表示します。「OK」で進めるとダウンロードが始まり、進捗が表示されます。「キャンセル」を選ぶとダウンロードは行わず、簡易要約(重要文抽出)にフォールバックします。一度ダウンロードが完了すれば次回以降は確認ダイアログなしで即時に要約できます。
- AIモデルがダウンロード済みか確認できますか?
- 本ツール画面上部の「AIモデル: 利用可能(DL済み)」表示で確認できます。Chrome の管理画面から直接確認したい場合は、アドレスバーに「chrome://components/」と入力して「Optimization Guide On Device Model」のバージョン番号をご覧ください。0.0.0.0 や空欄なら未取得、数字(例:2024.6.5.2205)が入っていれば取得済みです。より詳細な情報は「chrome://on-device-internals/」で確認できます。
- AI要約のためにOpenAI APIキーやChatGPTアカウントは必要ですか?
- 不要です。お使いのブラウザに搭載された AI 機能を直接呼び出すため、外部サービスのアカウント・APIキー・クレジットカード登録は一切必要ありません。料金も発生しません。
- 議事録としてそのまま使えますか?
- 文字起こしと AI 要約を組み合わせれば、議事録のたたき台として活用できます。話者の自動分離には対応していないため、必要に応じて編集時に「Aさん:」「Bさん:」などを手で挿入してください。要約は会議の決定事項・論点の整理に役立ちます。
- 音声データはどこかに保存されますか?
- 文字起こし結果と要約は当サイトのサーバーには一切送信・保存されません。ただし、音声認識の処理にはブラウザの音声認識エンジン(多くの場合 Google のサーバー)が使われるため、音声データはブラウザ→認識エンジンへ送信されます。極めて機密性の高い内容を扱う場合は、オフライン処理に対応した有償の専用サービスをご検討ください。
- 対応しているブラウザは?
- Google Chrome および Microsoft Edge の最新版を推奨します。AI 要約機能は Chrome 138 以降の対応端末で利用できます。Safari の最新版でも文字起こしは動作しますが、AI 要約は簡易要約にフォールバックします。Firefox は現状 Web Speech API に対応していないため利用できません。
- 認識精度を上げるコツはありますか?
- 静かな環境で、マイクに近い位置からはっきり話すと精度が上がります。USB マイクや外付けピンマイクを使うとさらに改善することがあります。専門用語や固有名詞は誤認識されやすいため、文字起こし後に編集してから要約すると、より精度の高いサマリが得られます。
- 録音の長さに上限はありますか?
- 当ツール側では上限を設けていません。ただし Web Speech API は無音状態が続くと自動で停止する仕様があるため、本ツールでは自動的に再開するようにしています。長時間使用する場合はテキストが消えないよう、こまめにダウンロードしてください。
- 既にあるテキスト(メモ・記事原稿)の要約だけ使えますか?
- はい。文字起こし結果のテキストエリアに直接テキストを貼り付けて「要約する」ボタンを押せば、貼り付けたテキストをそのまま要約できます。会議メモ・記事下書き・長いメールの要点抽出にもお使いいただけます。