OpenTranscript

YouTube和音频转文字,
免费且无需上传

粘贴YouTube链接或拖入音频文件。转录在浏览器内完成,音频不会离开你的设备。

或拖入音频文件
将音频文件拖到这里
或点击选择文件 · mp3, wav, m4a, ogg, webm
100% 隐私 音频永远不会离开你的设备
99+ 语言 Whisper 支持
0 注册 无需账户,无需个人信息

为什么选择 OpenTranscript

你的音频留在你的设备上。

音频不会上传到任何地方

Whisper在浏览器内部运行。没有中间服务器,没有上传,没有存储录音的数据库。

YouTube:粘贴链接即可

直接从YouTube获取字幕。无需安装扩展,无需下载视频。

真正免费,没有套路

计算由你的设备完成,为你提供服务不需要任何成本,所以我们不需要收费。无需账号,无限制,没有「7天免费试用」。

自动适配你的设备

自动检测兼容GPU和可用内存。高性能GPU用大模型,精度更高;老旧笔记本用轻量模型,同样好用。

适用场景

不只是YouTube。任何需要转文字的音频都可以。

播客转文字

将播客单集转为文字,用于撰写节目描述、文章,或快速找到某段具体内容。

会议记录

用手机录下会议,把音频拖到这里,几分钟内就能得到完整的会议纪要,无需任何人手动记录。

课堂与讲座转录

录下课堂内容,转为文字后以书面形式复习。比奋力抄笔记高效得多。

提取YouTube视频文字

需要视频文字来引用、摘要或翻译?粘贴链接,复制结果,两步搞定。

采访录音转文字

记者、研究人员、用户研究员:无需将录音上传到第三方服务,直接在本地完成采访转录。

无障碍辅助

将音频内容转为文字,方便有听力障碍的用户,或那些更喜欢阅读而非收听的人使用。

使用方法

三个步骤。无需注册,无需等待。

粘贴链接或上传音频

粘贴YouTube链接,或拖入mp3、wav、m4a文件。文件不会离开浏览器。

处理文本

YouTube视频直接提取字幕。音频文件由Whisper在你的设备上用CPU或GPU转录。

复制或下载

文本随时可以粘贴到任何地方。也可以下载为 .txt 或 .md 格式。

OpenTranscript与其他服务对比

最大的区别:你的音频留在你的设备上。

OpenTranscript 同类服务
费用 永久免费 每分钟0.006至0.05欧元
隐私 音频不离开你的设备 音频上传至其服务器
注册 无需注册 必须注册
时长限制 无限制 免费版有限制
速度 取决于你的设备 专用GPU服务器
最高精度 whisper-small(非常好) whisper-large(最佳)

Whisper模型对比

模型越大精度越高,但也越重。我们会自动为你的设备选择最合适的模型。

whisper-tiny

大小
75 MB
速度
非常快
精度
良好
设备
CPU
适合手机和老旧设备。对主要语言的清晰录音效果不错。

whisper-base

大小
145 MB
速度
精度
很好
设备
GPU / CPU
最佳平衡选择。在大多数现代笔记本上运行良好。

whisper-small

大小
480 MB
速度
适中
精度
优秀
设备
GPU
最高精度。需要支持WebGPU的GPU设备。

Whisper支持转录的语言

Whisper可识别99种以上语言,以下是最常用的语言。

西班牙语 英语 法语 德语 意大利语 葡萄牙语 俄语 日语 韩语 中文 阿拉伯语 印地语 土耳其语 荷兰语 波兰语 瑞典语 挪威语 丹麦语 芬兰语 希腊语 捷克语 罗马尼亚语 匈牙利语 泰语 越南语 印度尼西亚语 马来语 菲律宾语 乌克兰语 加泰罗尼亚语
以及70多种其他语言

常见问题

大家在使用前最常问的问题。

音频会上传到服务器吗?

不会。Whisper模型一次性下载到浏览器后,所有处理都在本地完成。文件不会在任何时候离开你的设备。

真的免费吗?有什么隐藏条件?

免费是因为计算由你自己的设备完成,而非我们的服务器,所以没有服务器成本。没有时长限制,也没有文件数量限制。

支持所有YouTube视频吗?

支持有字幕的视频(绝大多数都有)。如果视频没有字幕,你可以下载音频后拖到这里,由Whisper进行转录。

转文字需要多长时间?

取决于你的设备。使用兼容GPU(Chrome 113+或Edge 113+的WebGPU),5分钟音频大约需要15到30秒。没有GPU仅用CPU则需要1到3分钟。首次使用因需下载模型会更慢一些。

支持哪些音频格式?

支持mp3、wav、m4a、ogg和webm。mp4等视频格式在大多数现代浏览器中也可以使用。

支持哪些语言的转录?

Whisper支持多语言:中文、英语、日语、韩语、西班牙语、法语、德语、阿拉伯语等数十种语言。你可以手动指定语言,也可以让它自动检测。

需要什么浏览器?

任何现代浏览器都可以使用。要获得最快速度(WebGPU加速),需要Chrome 113+或Edge 113+。Firefox和Safari以CPU模式运行,速度稍慢但精度相同。

为什么第一次使用会更慢?

第一次需要下载Whisper模型(根据档位在75MB到480MB之间)。下载后会保存在浏览器缓存中,之后使用会立即开始。

转录精度如何?质量怎么样?

取决于所选模型。whisper-small(480MB)在主要语言上精度非常高。whisper-tiny速度更快,但遇到口音较重或背景噪音时错误会增多。对于音质良好的会议录音,三个模型的输出都完全可用。

手机上可以使用吗?

可以,但速度较慢。手机不支持WebGPU,所以Whisper只能用CPU运行。5分钟的音频可能需要3到5分钟处理。在笔记本或台式机上体验会好得多。

音频时长有限制吗?

没有设置任何限制。唯一的约束是你设备的内存大小。拥有8GB或更多内存的设备,处理2到3小时的音频都没有问题。

我的数据安全吗?符合GDPR规定吗?

你的音频从不离开你的设备,因此我们这边没有任何需要保护的个人数据。我们不使用追踪Cookie,也不收集任何个人信息。

立即开始转录

无需账号,无需安装任何东西,音频不会离开你的设备。