Conversor de VOC para NIST

Salve gravações Sound Blaster VOC no formato NIST

Solte os arquivos aqui. 1 GB tamanho máximo do ficheiro ou Registar-se
para
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Integração de Pesquisa

NIST é o contêiner padrão para corpus de fala. Converter VOC para NIST integra gravações do Sound Blaster em pipelines de pesquisa.

Processamento em Lote

Construa corpus de fala eficientemente — envie múltiplos arquivos VOC e produza saídas NIST para todos em uma única sessão.

Privado e Seguro

Áudio de pesquisa frequentemente contém dados de fala sensíveis. Arquivos VOC enviados são excluídos imediatamente, saídas NIST em até 24 horas.

Como converter VOC para NIST

1

Selecione os arquivos do seu computador, Google Drive, Dropbox ou adicione um URL. Você também pode simplesmente arrastá-lo para esta página.

2

Escolha nist ou qualquer outro formato de saída desejado (mais de 200 formatos compatíveis)

3

Espere o arquivo ser convertido e você poderá, então, baixar o seu arquivo nist

Sobre os formatos

VOC (Creative Voice) é um container de áudio digital desenvolvido pela Creative Technology é introduzido junto com a placa Sound Blaster original em 1989. Ele serviu como o formato de áudio nativo da família Sound Blaster durante a era DOS, quando o hardware da Creative dominava o áudio de PC. Os arquivos VOC são baseados em blocos: cada arquivo consiste em blocos de dados tipados que podem conter PCM de 8 bits não assinado, ADPCM Creative de 4 bits é 2,6 bits, PCM assinado de 16 bits, além de áudio codificado em A-law é mu-law. Essa estrutura de blocos também suporta intervalos de silencio, loops de repetição é pontos de marcação, dando aos desenvolvedores de jogos controle refinado sobre a reprodução de som. Uma vantagem notavel era a decodificação em nível de hardware — às placas Sound Blaster podiam reproduzir dados VOC diretamente via transferência DMA, liberando a CPU para outras tarefas em uma era em que ciclos de processador eram preciosos. O formato teve uso extensivo em jogos DOS da id Software, Sierra é LucasArts. Com a ascensao do Windows é do formato WAV, o VOC gradualmente saiu do uso convencional, mas permanece importante para preservação de jogos retrô é para quem trabalha com acervos de áudio vintage de PC.
Desenvolvedor: Creative Technology
Lançamento inicial: 1989
NIST SPHERE (SPeech HEader REsources) é um formato de arquivo de áudio especializado criado pelo National Institute of Standards and Technology para pesquisa em fala, particularmente projetos financiados pela DARPA. O formato envolve amostras de áudio brutas com um cabecalho ASCII estruturado codificando metadados como taxa de amostragem, contagem de canais, tipo de codificação, dados demograficos do falante é anotações de transcrição — tornando-o ideal para distribuição de corpora de fala. Os arquivos NIST normalmente armazenam PCM sem compressão ou áudio mu-law em taxas de amostragem de qualidade telefônica (8 kHz ou 16 kHz), embora o container seja flexível o suficiente para conter várias codificacoes. Uma vantagem chave é o cabecalho rico é autodescritivo que permite que pesquisadores incorporem metadados detalhados de corpus diretamente no arquivo, eliminando arquivos auxiliares. O SPHERE também se tornou o padrão de facto para grandes bancos de dados de fala como TIMIT, Switchboard é o corpus Fisher, garantindo amplo reconhecimento em laboratorios acadêmicos é governamentais. A especificação aberta é a disponibilidade de ferramentas de linha de comando (sphere, h_strip, w_decode) tornam simples converter, inspecionar é processar esses arquivos programaticamente em pipelines de processamento de fala.
Lançamento inicial: 1990

Perguntas Frequentes

Por que converter VOC para NIST?

NIST armazena áudio com cabeçalhos de metadados para pesquisa de fala. Integra áudio legado em fluxos de trabalho de pesquisa linguística acadêmica.

O que pode abrir arquivos NIST?

O toolkit NIST SPHERE e SoX leem NIST. Frameworks de reconhecimento de fala como Kaldi e HTK também suportam esse formato nativamente.

Como NIST difere de WAV?

NIST usa um cabeçalho baseado em texto com campos de metadados ricos — muito mais descritivo que o cabeçalho binário usado pelos arquivos WAV.

O formato NIST é usado no Kaldi?

Sim. Kaldi, um dos toolkits de reconhecimento de fala mais populares, lê arquivos NIST SPHERE diretamente para treinamento e decodificação.

Posso converter múltiplos arquivos VOC em lote?

Envie todas as suas gravações VOC e converta-as para NIST simultaneamente — eficiente quando se constrói um corpus de fala de múltiplas fontes.