OpenTranscript

Transcribir YouTube y audio,
gratis y sin subir nada

Pega un enlace de YouTube o arrastra un archivo de audio. Whisper lo transcribe en tu navegador y el audio nunca sale de tu equipo.

O arrastra un archivo de audio
Arrastra un archivo de audio aquí
o haz clic para elegirlo · mp3, wav, m4a, ogg, webm
100 % Privado Tu audio nunca sale de tu equipo
99+ Idiomas Soportados por Whisper
0 Registro Ni cuenta ni datos personales

Por qué OpenTranscript

Tu audio se queda en tu equipo.

Tu audio no se sube a ningún sitio

Whisper corre dentro de tu navegador. No hay servidor intermedio, no hay upload, ninguna base de datos almacena tus grabaciones.

YouTube: pega el enlace y listo

Sacamos los subtítulos directamente de YouTube. No necesitas instalar extensiones ni bajar el vídeo.

Gratis porque el coste es tuyo

El cálculo lo hace tu máquina, no la nuestra. Eso significa que no nos cuesta nada servirte y no necesitamos cobrarte. No hay plan de pago ni "prueba de 7 días".

Se adapta a tu equipo

Detectamos si tienes GPU compatible y cuánta RAM tienes. Equipo potente = modelo grande. Portátil antiguo = modelo ligero que funciona igual.

Para qué puedes usarlo

No solo YouTube. Cualquier audio que necesites convertir en texto.

Transcribir podcasts

Pasa tus episodios a texto para crear show notes, artículos o buscar ese fragmento concreto que no encuentras.

Transcribir reuniones

Graba la reunión con el móvil, arrastra el audio aquí y en minutos tienes el acta completa.

Clases y conferencias

Para estudiantes: graba la clase, transcribe y repasa por escrito. Mucho mejor que intentar apuntar todo a mano.

Sacar texto de vídeos de YouTube

¿Necesitas el texto de un vídeo para citar, resumir o traducir? Pega el enlace, copia el resultado.

Entrevistas

Periodistas, investigadores, UX researchers: transcribe entrevistas sin subir las grabaciones a servicios de terceros.

Accesibilidad

Convierte contenido de audio en texto para personas con discapacidad auditiva o para quienes prefieren leer.

Cómo funciona

Tres pasos, cero cuentas.

Pega el enlace o sube tu audio

Enlace de YouTube, o arrastra un mp3, wav o m4a. Tu archivo no sale del navegador.

Procesamos el texto

Para YouTube sacamos los subtítulos directamente. Para archivos de audio, Whisper transcribe en tu dispositivo usando tu CPU o GPU.

Copia o descarga

Texto listo para pegar donde quieras. Puedes descargarlo como .txt o .md.

OpenTranscript frente a otros servicios

La diferencia principal: tu audio se queda en tu equipo.

OpenTranscript Servicios típicos
Coste Gratis 0,006 a 0,05 €/min
Privacidad El audio no sale de tu equipo El audio se sube a sus servidores
Registro No necesario Obligatorio
Límite de minutos Ninguno Limitado en plan gratuito
Velocidad Depende de tu equipo Servidores GPU dedicados
Precisión máxima whisper-small (muy buena) whisper-large (excelente)

Compara los modelos de Whisper

Más grande = más preciso, pero más pesado. Elegimos el mejor para tu equipo automáticamente.

whisper-tiny

Tamaño
75 MB
Velocidad
Muy rápido
Precisión
Buena
Dispositivo
CPU
Móviles y equipos antiguos. Bueno para audio limpio en idiomas principales.

whisper-base

Tamaño
145 MB
Velocidad
Rápido
Precisión
Muy buena
Dispositivo
GPU / CPU
El equilibrio ideal. Funciona bien en la mayoría de portátiles modernos.

whisper-small

Tamaño
480 MB
Velocidad
Moderado
Precisión
Excelente
Dispositivo
GPU
Máxima precisión. Necesita un equipo con GPU compatible (WebGPU).

Idiomas que Whisper puede transcribir

Whisper reconoce más de 99 idiomas. Estos son los más utilizados.

Español Inglés Francés Alemán Italiano Portugués Ruso Japonés Coreano Chino Árabe Hindi Turco Holandés Polaco Sueco Noruego Danés Finés Griego Checo Rumano Húngaro Tailandés Vietnamita Indonesio Malayo Filipino Ucraniano Catalán
y más de 70 idiomas adicionales

Preguntas frecuentes

Lo que pregunta todo el mundo antes de probarlo.

¿Se sube el audio a algún servidor?

No. El modelo Whisper se descarga una vez en tu navegador y todo el procesamiento ocurre ahí. Ningún archivo sale de tu equipo.

¿Es gratis? ¿Hay algún truco?

Es gratis porque el cálculo lo hace tu propio dispositivo. No tenemos servidores procesando audio, así que no tenemos costes que trasladarte. No hay límites de minutos ni de archivos.

¿Funciona con cualquier vídeo de YouTube?

Funciona con vídeos que tienen subtítulos disponibles, que son la gran mayoría. Si un vídeo no tiene subtítulos, puedes descargar el audio y arrastrarlo aquí para que Whisper lo transcriba.

¿Cuánto tarda en transcribir un audio?

Depende de tu equipo. Con GPU compatible (WebGPU en Chrome o Edge), un audio de 5 minutos tarda unos 15-30 segundos. En CPU pura, entre 1 y 3 minutos. La primera vez tarda más porque tiene que descargar el modelo.

¿Qué formatos de audio acepta?

mp3, wav, m4a, ogg y webm. Los formatos de vídeo como mp4 también funcionan en la mayoría de navegadores modernos.

¿En qué idiomas puede transcribir?

Whisper entiende más de 99 idiomas: español, inglés, francés, alemán, italiano, portugués, japonés, chino, árabe y muchos más. Puedes forzar el idioma o dejar la detección automática.

¿Qué navegador necesito?

Cualquier navegador moderno. Para máxima velocidad con WebGPU necesitas Chrome 113+ o Edge 113+. En Firefox y Safari funciona con CPU: algo más lento pero igual de preciso.

¿Por qué la primera vez tarda más?

Porque tiene que descargar el modelo de Whisper (entre 75 MB y 480 MB según el que elijas). Se guarda en la caché del navegador, así que la segunda vez es instantáneo.

¿Es preciso? ¿Qué calidad tiene la transcripción?

Depende del modelo. whisper-small (480 MB) tiene una precisión muy alta en los idiomas principales. whisper-tiny es más rápido pero comete más errores con acentos o ruido de fondo. Para reuniones con buena calidad de audio, los tres modelos dan resultados muy usables.

¿Funciona en el móvil?

Sí, pero más lento. Los móviles no tienen WebGPU, así que Whisper corre en la CPU. Un audio de 5 minutos puede tardar 3-5 minutos en un móvil. En un portátil la experiencia es mucho mejor.

¿Hay límite de duración del audio?

No imponemos ninguno. El único límite real es la memoria RAM de tu dispositivo. Audios de hasta 2-3 horas funcionan bien en equipos con 8 GB de RAM o más.

¿Mis datos están seguros? ¿Cumple con el RGPD?

Tu audio nunca sale de tu dispositivo, así que no hay datos personales que proteger de nuestra parte. No usamos cookies de seguimiento ni recopilamos información personal.

Transcribe ahora

No necesitas cuenta. No necesitas instalar nada. El audio no sale de tu equipo.