Skip to content
Ferramentas de Vídeo

Gerador de Legendas

Gere automaticamente legendas cronometradas de qualquer arquivo de áudio ou vídeo usando IA. Suporta 99 idiomas e baixe como SRT ou VTT. Não é necessário cadastro para começar.

Free in browser No sign-up required Files stay on your device
>

Drop audio or video file here

MP3, MP4, WAV, WebM, OGG, M4A

Files processed locally — never uploaded
How it works

Run this tool in three short steps.

01

Envie áudio ou vídeo

Arraste um arquivo ou clique para procurar. O áudio é extraído automaticamente de arquivos de vídeo.

02

Whisper transcreve localmente

O modelo de IA Whisper é executado no seu navegador. O áudio de origem não é enviado aos nossos servidores durante a transcrição.

03

Baixe SRT ou VTT

Revise e edite a transcrição, depois baixe no formato SRT ou VTT.

Questions

What people ask before they use this tool.

Como funciona o gerador de legendas?
Usamos o OpenAI Whisper (modelo Base) compilado para WebAssembly e executando no seu navegador. Seu áudio é processado localmente durante a transcrição e não é enviado aos nossos servidores.
Quais formatos de áudio/vídeo são compatíveis?
MP3, MP4, WAV, WebM, OGG, M4A, FLAC e a maioria dos formatos comuns de áudio/vídeo. A ferramenta extrai a faixa de áudio automaticamente.
Quantos idiomas são suportados?
O Whisper suporta 99 idiomas incluindo inglês, espanhol, francês, alemão, chinês, japonês, coreano, árabe, hindi e mais. Selecione seu idioma ou use a detecção automática.
Quais formatos de legenda posso baixar?
SRT (mais comum, funciona em todos os lugares) e VTT (WebVTT, para reprodutores de vídeo web). Ambos incluem marcas de tempo e texto segmentado.
Quão precisas são as legendas?
O Whisper Base oferece boa precisão para fala clara em idiomas compatíveis. Os resultados geralmente são melhores com áudio que tem ruído de fundo mínimo. A precisão de nível profissional requer o modelo Large (não disponível no navegador).
Por que a primeira transcrição demora mais?
O modelo Whisper Base (~57MB) é baixado no primeiro uso. Depois fica em cache no seu navegador. As transcrições posteriores iniciam imediatamente.
Meu áudio é enviado para algum servidor?
Não. O Whisper é executado no seu navegador via WebAssembly. Seu áudio é processado localmente durante a transcrição e não é enviado aos nossos servidores.
Quanto tempo leva a transcrição?
Aproximadamente 1-3x o tempo real em dispositivos modernos. Um clipe de 5 minutos leva 5-15 minutos. Navegadores de desktop são significativamente mais rápidos que os móveis.
Posso editar as legendas antes de baixar?
Sim. O texto transcrito aparece em uma área editável. Corrija erros, ajuste o timing, depois baixe.
Funciona no celular?
Sim, mas a transcrição consome muitos recursos de CPU. Clipes curtos (menos de 2 minutos) funcionam bem em celulares. Para áudio mais longo, use um navegador de desktop.
Qual é o limite de tamanho de arquivo?
Depende da memória do seu dispositivo. O áudio é processado em fragmentos. A maioria dos dispositivos suporta arquivos de até 100MB.
Posso transcrever um vídeo do YouTube?
Não diretamente. Baixe o vídeo primeiro, depois envie o arquivo. Ou use nosso <a href="/pt/youtube-summarizer">Resumidor de YouTube</a> para resumos de texto.
Como se compara com Otter.ai ou Rev?
Otter e Rev usam modelos baseados na nuvem e podem alcançar maior precisão em alguns fluxos de trabalho. Nosso diferencial é a abordagem local do navegador: a transcrição é executada sem enviar seu áudio de origem aos nossos servidores. A precisão é sólida para fala clara, mas não de nível broadcast.
É realmente grátis?
Sim. A ferramenta é gratuita no navegador e não requer cadastro para começar.
Posso pagar com criptomoedas?
As ferramentas de vídeo são gratuitas. Para ferramentas de escrita com IA, aceitamos USDT, USDC, BTC, ETH. Os planos começam em $9,99/mês.
Related

Continue the workflow

100+ free AI tools

Writing, PDF, image, and developer tools — all in your browser.

O Gerador de Legendas do Coda One usa OpenAI Whisper (modelo Base) compilado para WebAssembly e executando no seu navegador. Transcreve áudio e vídeo em legendas cronometradas em 99 idiomas. Baixe como SRT ou VTT. O áudio de origem permanece no seu navegador durante a transcrição e não é enviado aos nossos servidores.