YouTube和音频转文字,
免费且无需上传
粘贴YouTube链接或拖入音频文件。转录在浏览器内完成,音频不会离开你的设备。
为什么选择 OpenTranscript
你的音频留在你的设备上。
音频不会上传到任何地方
Whisper在浏览器内部运行。没有中间服务器,没有上传,没有存储录音的数据库。
YouTube:粘贴链接即可
直接从YouTube获取字幕。无需安装扩展,无需下载视频。
真正免费,没有套路
计算由你的设备完成,为你提供服务不需要任何成本,所以我们不需要收费。无需账号,无限制,没有「7天免费试用」。
自动适配你的设备
自动检测兼容GPU和可用内存。高性能GPU用大模型,精度更高;老旧笔记本用轻量模型,同样好用。
适用场景
不只是YouTube。任何需要转文字的音频都可以。
播客转文字
将播客单集转为文字,用于撰写节目描述、文章,或快速找到某段具体内容。
会议记录
用手机录下会议,把音频拖到这里,几分钟内就能得到完整的会议纪要,无需任何人手动记录。
课堂与讲座转录
录下课堂内容,转为文字后以书面形式复习。比奋力抄笔记高效得多。
提取YouTube视频文字
需要视频文字来引用、摘要或翻译?粘贴链接,复制结果,两步搞定。
采访录音转文字
记者、研究人员、用户研究员:无需将录音上传到第三方服务,直接在本地完成采访转录。
无障碍辅助
将音频内容转为文字,方便有听力障碍的用户,或那些更喜欢阅读而非收听的人使用。
使用方法
三个步骤。无需注册,无需等待。
粘贴链接或上传音频
粘贴YouTube链接,或拖入mp3、wav、m4a文件。文件不会离开浏览器。
处理文本
YouTube视频直接提取字幕。音频文件由Whisper在你的设备上用CPU或GPU转录。
复制或下载
文本随时可以粘贴到任何地方。也可以下载为 .txt 或 .md 格式。
OpenTranscript与其他服务对比
最大的区别:你的音频留在你的设备上。
| OpenTranscript | 同类服务 | |
|---|---|---|
| 费用 | 永久免费 | 每分钟0.006至0.05欧元 |
| 隐私 | 音频不离开你的设备 | 音频上传至其服务器 |
| 注册 | 无需注册 | 必须注册 |
| 时长限制 | 无限制 | 免费版有限制 |
| 速度 | 取决于你的设备 | 专用GPU服务器 |
| 最高精度 | whisper-small(非常好) | whisper-large(最佳) |
Whisper模型对比
模型越大精度越高,但也越重。我们会自动为你的设备选择最合适的模型。
whisper-tiny
- 大小
- 75 MB
- 速度
- 非常快
- 精度
- 良好
- 设备
- CPU
whisper-base
- 大小
- 145 MB
- 速度
- 快
- 精度
- 很好
- 设备
- GPU / CPU
whisper-small
- 大小
- 480 MB
- 速度
- 适中
- 精度
- 优秀
- 设备
- GPU
Whisper支持转录的语言
Whisper可识别99种以上语言,以下是最常用的语言。
常见问题
大家在使用前最常问的问题。
音频会上传到服务器吗?
不会。Whisper模型一次性下载到浏览器后,所有处理都在本地完成。文件不会在任何时候离开你的设备。
真的免费吗?有什么隐藏条件?
免费是因为计算由你自己的设备完成,而非我们的服务器,所以没有服务器成本。没有时长限制,也没有文件数量限制。
支持所有YouTube视频吗?
支持有字幕的视频(绝大多数都有)。如果视频没有字幕,你可以下载音频后拖到这里,由Whisper进行转录。
转文字需要多长时间?
取决于你的设备。使用兼容GPU(Chrome 113+或Edge 113+的WebGPU),5分钟音频大约需要15到30秒。没有GPU仅用CPU则需要1到3分钟。首次使用因需下载模型会更慢一些。
支持哪些音频格式?
支持mp3、wav、m4a、ogg和webm。mp4等视频格式在大多数现代浏览器中也可以使用。
支持哪些语言的转录?
Whisper支持多语言:中文、英语、日语、韩语、西班牙语、法语、德语、阿拉伯语等数十种语言。你可以手动指定语言,也可以让它自动检测。
需要什么浏览器?
任何现代浏览器都可以使用。要获得最快速度(WebGPU加速),需要Chrome 113+或Edge 113+。Firefox和Safari以CPU模式运行,速度稍慢但精度相同。
为什么第一次使用会更慢?
第一次需要下载Whisper模型(根据档位在75MB到480MB之间)。下载后会保存在浏览器缓存中,之后使用会立即开始。
转录精度如何?质量怎么样?
取决于所选模型。whisper-small(480MB)在主要语言上精度非常高。whisper-tiny速度更快,但遇到口音较重或背景噪音时错误会增多。对于音质良好的会议录音,三个模型的输出都完全可用。
手机上可以使用吗?
可以,但速度较慢。手机不支持WebGPU,所以Whisper只能用CPU运行。5分钟的音频可能需要3到5分钟处理。在笔记本或台式机上体验会好得多。
音频时长有限制吗?
没有设置任何限制。唯一的约束是你设备的内存大小。拥有8GB或更多内存的设备,处理2到3小时的音频都没有问题。
我的数据安全吗?符合GDPR规定吗?
你的音频从不离开你的设备,因此我们这边没有任何需要保护的个人数据。我们不使用追踪Cookie,也不收集任何个人信息。
立即开始转录
无需账号,无需安装任何东西,音频不会离开你的设备。