Skip to content
Herramientas de Video

Generador de Subtítulos

Genera automáticamente subtítulos cronometrados de cualquier archivo de audio o video usando IA. Soporta 99 idiomas y descarga como SRT o VTT. No se requiere registro para comenzar.

Free in browser No sign-up required Files stay on your device
>

Drop audio or video file here

MP3, MP4, WAV, WebM, OGG, M4A

Files processed locally — never uploaded
How it works

Run this tool in three short steps.

01

Sube audio o video

Arrastra un archivo o haz clic para buscar. El audio se extrae automáticamente de archivos de video.

02

Whisper transcribe localmente

El modelo de IA Whisper se ejecuta en tu navegador. El audio fuente no se sube a nuestros servidores durante la transcripción.

03

Descarga SRT o VTT

Revisa y edita la transcripción, luego descarga en formato SRT o VTT.

Questions

What people ask before they use this tool.

¿Cómo funciona el generador de subtítulos?
Usamos OpenAI Whisper (modelo Base) compilado a WebAssembly y ejecutándose en tu navegador. Tu audio se procesa localmente durante la transcripción y no se sube a nuestros servidores.
¿Qué formatos de audio/video son compatibles?
MP3, MP4, WAV, WebM, OGG, M4A, FLAC y la mayoría de los formatos comunes de audio/video. La herramienta extrae la pista de audio automáticamente.
¿Cuántos idiomas soporta?
Whisper soporta 99 idiomas incluyendo inglés, español, francés, alemán, chino, japonés, coreano, árabe, hindi y más. Selecciona tu idioma o usa la detección automática.
¿Qué formatos de subtítulos puedo descargar?
SRT (más común, funciona en todas partes) y VTT (WebVTT, para reproductores de video web). Ambos incluyen marcas de tiempo y texto segmentado.
¿Qué tan precisos son los subtítulos?
Whisper Base proporciona buena precisión para habla clara en idiomas compatibles. Los resultados suelen ser mejores con audio que tiene ruido de fondo mínimo. La precisión de nivel profesional requiere el modelo Large (no disponible en el navegador).
¿Por qué la primera transcripción tarda más?
El modelo Whisper Base (~57MB) se descarga en el primer uso. Después se almacena en caché en tu navegador. Las transcripciones posteriores inician inmediatamente.
¿Se sube mi audio a un servidor?
No. Whisper se ejecuta en tu navegador vía WebAssembly. Tu audio se procesa localmente durante la transcripción y no se sube a nuestros servidores.
¿Cuánto tarda la transcripción?
Aproximadamente 1-3x el tiempo real en dispositivos modernos. Un clip de 5 minutos toma 5-15 minutos. Los navegadores de escritorio son significativamente más rápidos que los móviles.
¿Puedo editar los subtítulos antes de descargar?
Sí. El texto transcrito aparece en un área editable. Corrige errores, ajusta el timing, luego descarga.
¿Funciona en móvil?
Sí, pero la transcripción consume muchos recursos de CPU. Los clips cortos (menos de 2 minutos) funcionan bien en teléfonos. Para audio más largo, usa un navegador de escritorio.
¿Cuál es el límite de tamaño de archivo?
Depende de la memoria de tu dispositivo. El audio se procesa en fragmentos. La mayoría de los dispositivos manejan archivos de hasta 100MB.
¿Puedo transcribir un video de YouTube?
No directamente. Descarga el video primero, luego sube el archivo. O usa nuestro <a href="/es/youtube-summarizer">Resumidor de YouTube</a> para resúmenes de texto.
¿Cómo se compara con Otter.ai o Rev?
Otter y Rev usan modelos basados en la nube y pueden alcanzar mayor precisión en algunos flujos de trabajo. Nuestra diferencia es el enfoque local del navegador: la transcripción se ejecuta sin subir tu audio fuente a nuestros servidores. La precisión es sólida para habla clara pero no de nivel broadcast.
¿Es realmente gratis?
Sí. La herramienta es gratuita en el navegador y no requiere registro para comenzar.
¿Puedo pagar con criptomonedas?
Las herramientas de video son gratuitas. Para herramientas de escritura con IA, aceptamos USDT, USDC, BTC, ETH. Los planes comienzan en $9.99/mes.
Related

Continue the workflow

100+ free AI tools

Writing, PDF, image, and developer tools — all in your browser.

El Generador de Subtítulos de Coda One usa OpenAI Whisper (modelo Base) compilado a WebAssembly y ejecutándose en tu navegador. Transcribe audio y video en subtítulos cronometrados en 99 idiomas. Descarga como SRT o VTT. El audio fuente permanece en tu navegador durante la transcripción y no se sube a nuestros servidores.