YouTube・音声を文字起こし、
無料でアップロード不要
YouTubeのURLを貼るか、音声ファイルをドラッグしてください。文字起こしはブラウザ内で完結。音声がデバイスの外に出ることはありません。
OpenTranscriptを選ぶ理由
音声はあなたのデバイスに留まります。
音声はどこにもアップロードされない
Whisperはブラウザ内だけで動作します。中間サーバーなし、アップロードなし、録音データのデータベースなし。
YouTube:URLを貼るだけ
YouTubeから直接字幕を取得します。拡張機能のインストール不要、動画のダウンロード不要。
本当の意味で無料、裏なし
処理はあなたのデバイスが担うため、サービス提供にコストがかかりません。アカウント不要、制限なし、「7日間無料トライアル」もありません。
お使いの環境に自動対応
互換GPUとRAMの状況を検出します。高性能GPU搭載なら大きくて精度の高いモデルを、古いノートPCなら同じように動く軽量モデルを自動選択。
こんな用途に使えます
YouTubeだけじゃない。テキスト化したいあらゆる音声に対応。
ポッドキャストの文字起こし
エピソードをテキスト化して、ショーノートや記事の作成、あの発言をすぐ見つけるための検索用途に。
会議の文字起こし
スマートフォンで会議を録音し、音声をドラッグするだけ。数分で完全な議事録が完成します。
授業・講演の文字起こし
授業を録音して文字起こし、テキストで復習できます。手書きで必死にメモするより格段に効率的です。
YouTube動画からテキストを抽出
引用・要約・翻訳のために動画のテキストが必要なとき。URLを貼って結果をコピー、それだけです。
インタビューの文字起こし
ジャーナリスト、研究者、UXリサーチャーの方へ:録音データを外部サービスにアップすることなくインタビューを文字起こしできます。
アクセシビリティ
聴覚障害のある方や、聴くよりも読むことを好む方のために、音声コンテンツをテキストに変換します。
使い方
3ステップ。登録不要、待ち時間なし。
URLを貼るか音声をアップ
YouTubeのURLを貼るか、mp3・wav・m4aファイルをドラッグしてください。ファイルはブラウザの外に出ません。
テキストに変換
YouTubeの場合は字幕を直接取得します。音声ファイルの場合、WhisperがCPUまたはGPUを使ってデバイス上で文字起こしします。
コピーまたはダウンロード
好きなところにペーストできるテキストが完成します。.txt または .md としてダウンロードも可能です。
OpenTranscriptと他サービスの比較
最大の違い:音声がデバイスの外に出ません。
| OpenTranscript | 一般的なサービス | |
|---|---|---|
| 料金 | 無料 | 0.006〜0.05ユーロ/分 |
| プライバシー | 音声はデバイスの外に出ない | 音声がサーバーにアップロードされる |
| 登録 | 不要 | 必須 |
| 時間制限 | 制限なし | 無料プランは制限あり |
| 速度 | お使いのデバイスによる | 専用GPUサーバー |
| 最高精度 | whisper-small(非常に高精度) | whisper-large(最高精度) |
Whisperモデルを比較する
モデルが大きいほど精度が高いですが、処理も重くなります。お使いの環境に合わせて自動的に最適なモデルを選びます。
whisper-tiny
- サイズ
- 75 MB
- 速度
- 非常に速い
- 精度
- 良好
- デバイス
- CPU
whisper-base
- サイズ
- 145 MB
- 速度
- 速い
- 精度
- 非常に良好
- デバイス
- GPU / CPU
whisper-small
- サイズ
- 480 MB
- 速度
- 普通
- 精度
- 優秀
- デバイス
- GPU
Whisperが文字起こしできる言語
Whisperは99以上の言語に対応しています。よく使われる言語はこちら。
よくある質問
使う前に多くの方が気にすること。
音声はサーバーにアップロードされますか?
いいえ。Whisperモデルはブラウザにダウンロードされてローカルで処理します。ファイルがデバイスの外に出ることは一切ありません。
本当に無料ですか?何か裏がありますか?
処理はお使いのデバイスが行うため、サーバー費用が発生しません。そのため完全無料でご利用いただけます。分数制限もファイル数制限もありません。
すべてのYouTube動画に対応していますか?
字幕が利用可能な動画(大多数)に対応しています。字幕がない動画は、音声をダウンロードしてここにドラッグすることでWhisperで文字起こしできます。
文字起こしにどのくらい時間がかかりますか?
お使いの環境によります。WebGPU対応GPU(Chrome 113+またはEdge 113+)なら5分の音声で15〜30秒程度。GPUなしのCPU処理では1〜3分程度です。初回はモデルのダウンロードがあるため少し余分に時間がかかります。
対応している音声フォーマットは何ですか?
mp3、wav、m4a、ogg、webmに対応しています。mp4などの動画フォーマットも多くのモダンブラウザで動作します。
どの言語の文字起こしに対応していますか?
Whisperは多言語対応です。日本語、英語、フランス語、ドイツ語、イタリア語、ポルトガル語、中国語、アラビア語など多数の言語に対応しています。言語を指定することも、自動検出に任せることもできます。
どのブラウザが必要ですか?
モダンブラウザであれば動作します。WebGPUで最高速度を出すにはChrome 113+またはEdge 113+が必要です。FirefoxとSafariではCPUモードで動作し、少し遅くなりますが精度は変わりません。
初回だけ時間がかかるのはなぜですか?
初回はWhisperモデル(レベルにより75MBから480MB)をダウンロードします。ダウンロード後はブラウザのキャッシュに保存されるため、2回目以降はすぐに利用できます。
精度はどれくらいですか?文字起こしの品質は?
モデルによって異なります。whisper-small(480MB)は主要言語で非常に高い精度を発揮します。whisper-tinyはより速いですが、アクセントや背景ノイズがあると誤認識が増えます。音質のよい会議録音であれば、どのモデルでも十分実用的な結果が得られます。
スマートフォンでも使えますか?
使えますが、処理は遅くなります。スマートフォンはWebGPUに対応していないため、WhisperはCPUで動作します。5分の音声で3〜5分かかることがあります。ノートパソコンやデスクトップのほうがはるかに快適に使えます。
音声の長さに制限はありますか?
制限は設けていません。唯一の制約はお使いのデバイスのRAM容量です。8GB以上のRAMがあれば、2〜3時間の音声でも問題なく処理できます。
データは安全ですか?GDPRに対応していますか?
音声はデバイスの外に出ないため、当方が保護すべき個人データは存在しません。トラッキングCookieの使用も個人情報の収集も行っていません。
今すぐ文字起こしする
アカウント不要、インストール不要、音声はデバイスの外に出ません。