Conversor de VOC para HTK

Converta Sound Blaster VOC para o formato HTK de pesquisa

Solte os arquivos aqui. 1 GB tamanho máximo do ficheiro ou Registar-se
para
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Ferramenta de Pesquisa de Fala

HTK é a base da pesquisa de reconhecimento de fala. Converter gravações de voz VOC para HTK alimenta diretamente os fluxos de trabalho de treinamento de ML.

VOC para Dados de Pesquisa

Transforme gravações de voz do Sound Blaster em formato HTK — pronto para extração de características e treinamento de Modelos de Markov Ocultos.

Conversão Online

Sem linha de comando SoX. Converta seus arquivos VOC para HTK diretamente no navegador sem instalação local de ferramentas.

Como converter VOC para HTK

1

Selecione os arquivos do seu computador, Google Drive, Dropbox ou adicione um URL. Você também pode simplesmente arrastá-lo para esta página.

2

Escolha htk ou qualquer outro formato de saída desejado (mais de 200 formatos compatíveis)

3

Espere o arquivo ser convertido e você poderá, então, baixar o seu arquivo htk

Sobre os formatos

VOC (Creative Voice) é um container de áudio digital desenvolvido pela Creative Technology é introduzido junto com a placa Sound Blaster original em 1989. Ele serviu como o formato de áudio nativo da família Sound Blaster durante a era DOS, quando o hardware da Creative dominava o áudio de PC. Os arquivos VOC são baseados em blocos: cada arquivo consiste em blocos de dados tipados que podem conter PCM de 8 bits não assinado, ADPCM Creative de 4 bits é 2,6 bits, PCM assinado de 16 bits, além de áudio codificado em A-law é mu-law. Essa estrutura de blocos também suporta intervalos de silencio, loops de repetição é pontos de marcação, dando aos desenvolvedores de jogos controle refinado sobre a reprodução de som. Uma vantagem notavel era a decodificação em nível de hardware — às placas Sound Blaster podiam reproduzir dados VOC diretamente via transferência DMA, liberando a CPU para outras tarefas em uma era em que ciclos de processador eram preciosos. O formato teve uso extensivo em jogos DOS da id Software, Sierra é LucasArts. Com a ascensao do Windows é do formato WAV, o VOC gradualmente saiu do uso convencional, mas permanece importante para preservação de jogos retrô é para quem trabalha com acervos de áudio vintage de PC.
Desenvolvedor: Creative Technology
Lançamento inicial: 1989
HTK é o container de forma de onda nativo do Hidden Markov Model Toolkit, um pacote de software desenvolvido no Departamento de Engenharia da Universidade de Cambridge para pesquisa em reconhecimento de fala. Distribuido pela primeira vez em 1993, o HTK rapidamente se tornou uma plataforma de referência em laboratorios de linguística computacional em todo o mundo, e seu formato de arquivo seguiu o mesmo caminho. Cada arquivo armazena uma sequência de vetores de parâmetros ou amostras brutas precedidos por um cabecalho de 12 bytes especificando o número de quadros, o periodo do quadro em unidades de 100 ns, a contagem de bytes por quadro é um código de tipo indicando o tipo de dado — às opções vão desde PCM de forma de onda até coeficientes cepstrais de frequência Mel é energias de banco de filtros. Essa versatilidade permite que um único container carregue tanto áudio fonte quanto features extraidas sem alterar os analisadores. O cabecalho deliberadamente mínimo evita preenchimento de alinhamento ou blocos opcionais, tornando o formato trivial de ler a partir de C, Python ou MATLAB com poucas linhas de É/S binária. Três vantagens sustentam a relevancia duradoura do HTK: integração estreita com o pipeline de treinamento é reconhecimento HTK, layout de bytes deterministico que elimina ambiguidade no analisador é ampla adoção em corpora acadêmicos.
Lançamento inicial: 1993

Perguntas Frequentes

Por que converter VOC para HTK?

HTK é o formato de dados para o Hidden Markov Model Toolkit, amplamente usado em pesquisa de reconhecimento de fala. Prepara áudio para pipelines de treinamento de ML.

O que pode abrir arquivos HTK?

O toolkit HTK, SoX e frameworks personalizados de reconhecimento de fala leem arquivos HTK. Principalmente um formato de pesquisa e desenvolvimento.

O que é o formato HTK?

HTK é o formato de áudio do Hidden Markov Model Toolkit — para construir sistemas de reconhecimento de fala e armazenar recursos de áudio para ML.

HTK é usado fora da pesquisa?

HTK é principalmente acadêmico. Reconhecimento de fala comercial usa outros frameworks, mas HTK permanece fundamental para ensino e prototipagem.

Players comuns conseguem abrir HTK?

Arquivos HTK não são reproduzíveis em players de mídia padrão. Foram desenvolvidos para o toolkit HTK e pipelines de processamento de fala.