Transcribir YouTube y audio,
gratis y sin subir nada
Pega un enlace de YouTube o arrastra un archivo de audio. Whisper lo transcribe en tu navegador y el audio nunca sale de tu equipo.
Por qué OpenTranscript
Tu audio se queda en tu equipo.
Tu audio no se sube a ningún sitio
Whisper corre dentro de tu navegador. No hay servidor intermedio, no hay upload, ninguna base de datos almacena tus grabaciones.
YouTube: pega el enlace y listo
Sacamos los subtítulos directamente de YouTube. No necesitas instalar extensiones ni bajar el vídeo.
Gratis porque el coste es tuyo
El cálculo lo hace tu máquina, no la nuestra. Eso significa que no nos cuesta nada servirte y no necesitamos cobrarte. No hay plan de pago ni "prueba de 7 días".
Se adapta a tu equipo
Detectamos si tienes GPU compatible y cuánta RAM tienes. Equipo potente = modelo grande. Portátil antiguo = modelo ligero que funciona igual.
Para qué puedes usarlo
No solo YouTube. Cualquier audio que necesites convertir en texto.
Transcribir podcasts
Pasa tus episodios a texto para crear show notes, artículos o buscar ese fragmento concreto que no encuentras.
Transcribir reuniones
Graba la reunión con el móvil, arrastra el audio aquí y en minutos tienes el acta completa.
Clases y conferencias
Para estudiantes: graba la clase, transcribe y repasa por escrito. Mucho mejor que intentar apuntar todo a mano.
Sacar texto de vídeos de YouTube
¿Necesitas el texto de un vídeo para citar, resumir o traducir? Pega el enlace, copia el resultado.
Entrevistas
Periodistas, investigadores, UX researchers: transcribe entrevistas sin subir las grabaciones a servicios de terceros.
Accesibilidad
Convierte contenido de audio en texto para personas con discapacidad auditiva o para quienes prefieren leer.
Cómo funciona
Tres pasos, cero cuentas.
Pega el enlace o sube tu audio
Enlace de YouTube, o arrastra un mp3, wav o m4a. Tu archivo no sale del navegador.
Procesamos el texto
Para YouTube sacamos los subtítulos directamente. Para archivos de audio, Whisper transcribe en tu dispositivo usando tu CPU o GPU.
Copia o descarga
Texto listo para pegar donde quieras. Puedes descargarlo como .txt o .md.
OpenTranscript frente a otros servicios
La diferencia principal: tu audio se queda en tu equipo.
| OpenTranscript | Servicios típicos | |
|---|---|---|
| Coste | Gratis | 0,006 a 0,05 €/min |
| Privacidad | El audio no sale de tu equipo | El audio se sube a sus servidores |
| Registro | No necesario | Obligatorio |
| Límite de minutos | Ninguno | Limitado en plan gratuito |
| Velocidad | Depende de tu equipo | Servidores GPU dedicados |
| Precisión máxima | whisper-small (muy buena) | whisper-large (excelente) |
Compara los modelos de Whisper
Más grande = más preciso, pero más pesado. Elegimos el mejor para tu equipo automáticamente.
whisper-tiny
- Tamaño
- 75 MB
- Velocidad
- Muy rápido
- Precisión
- Buena
- Dispositivo
- CPU
whisper-base
- Tamaño
- 145 MB
- Velocidad
- Rápido
- Precisión
- Muy buena
- Dispositivo
- GPU / CPU
whisper-small
- Tamaño
- 480 MB
- Velocidad
- Moderado
- Precisión
- Excelente
- Dispositivo
- GPU
Idiomas que Whisper puede transcribir
Whisper reconoce más de 99 idiomas. Estos son los más utilizados.
Preguntas frecuentes
Lo que pregunta todo el mundo antes de probarlo.
¿Se sube el audio a algún servidor?
No. El modelo Whisper se descarga una vez en tu navegador y todo el procesamiento ocurre ahí. Ningún archivo sale de tu equipo.
¿Es gratis? ¿Hay algún truco?
Es gratis porque el cálculo lo hace tu propio dispositivo. No tenemos servidores procesando audio, así que no tenemos costes que trasladarte. No hay límites de minutos ni de archivos.
¿Funciona con cualquier vídeo de YouTube?
Funciona con vídeos que tienen subtítulos disponibles, que son la gran mayoría. Si un vídeo no tiene subtítulos, puedes descargar el audio y arrastrarlo aquí para que Whisper lo transcriba.
¿Cuánto tarda en transcribir un audio?
Depende de tu equipo. Con GPU compatible (WebGPU en Chrome o Edge), un audio de 5 minutos tarda unos 15-30 segundos. En CPU pura, entre 1 y 3 minutos. La primera vez tarda más porque tiene que descargar el modelo.
¿Qué formatos de audio acepta?
mp3, wav, m4a, ogg y webm. Los formatos de vídeo como mp4 también funcionan en la mayoría de navegadores modernos.
¿En qué idiomas puede transcribir?
Whisper entiende más de 99 idiomas: español, inglés, francés, alemán, italiano, portugués, japonés, chino, árabe y muchos más. Puedes forzar el idioma o dejar la detección automática.
¿Qué navegador necesito?
Cualquier navegador moderno. Para máxima velocidad con WebGPU necesitas Chrome 113+ o Edge 113+. En Firefox y Safari funciona con CPU: algo más lento pero igual de preciso.
¿Por qué la primera vez tarda más?
Porque tiene que descargar el modelo de Whisper (entre 75 MB y 480 MB según el que elijas). Se guarda en la caché del navegador, así que la segunda vez es instantáneo.
¿Es preciso? ¿Qué calidad tiene la transcripción?
Depende del modelo. whisper-small (480 MB) tiene una precisión muy alta en los idiomas principales. whisper-tiny es más rápido pero comete más errores con acentos o ruido de fondo. Para reuniones con buena calidad de audio, los tres modelos dan resultados muy usables.
¿Funciona en el móvil?
Sí, pero más lento. Los móviles no tienen WebGPU, así que Whisper corre en la CPU. Un audio de 5 minutos puede tardar 3-5 minutos en un móvil. En un portátil la experiencia es mucho mejor.
¿Hay límite de duración del audio?
No imponemos ninguno. El único límite real es la memoria RAM de tu dispositivo. Audios de hasta 2-3 horas funcionan bien en equipos con 8 GB de RAM o más.
¿Mis datos están seguros? ¿Cumple con el RGPD?
Tu audio nunca sale de tu dispositivo, así que no hay datos personales que proteger de nuestra parte. No usamos cookies de seguimiento ni recopilamos información personal.
Transcribe ahora
No necesitas cuenta. No necesitas instalar nada. El audio no sale de tu equipo.