Converter VOX para NIST

Salve gravações Dialogic VOX no formato NIST SPHERE

Solte os arquivos aqui. 1 GB tamanho máximo do ficheiro ou Registar-se
para
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Dados de Pesquisa de Telefonia

NIST integra áudio de telefonia em pesquisa acadêmica de fala — dados de voz do mundo real no formato padrão de corpus.

Construção de Corpus

Converta gravações de chamadas VOX para NIST em massa — eficiente para montar conjuntos de dados de fala de telefonia.

Segurança de Dados

Dados de fala requerem confidencialidade. Uploads VOX excluídos imediatamente, saídas NIST em 24 horas.

Como converter VOX para NIST

1

Selecione os arquivos do seu computador, Google Drive, Dropbox ou adicione um URL. Você também pode simplesmente arrastá-lo para esta página.

2

Escolha nist ou qualquer outro formato de saída desejado (mais de 200 formatos compatíveis)

3

Espere o arquivo ser convertido e você poderá, então, baixar o seu arquivo nist

Sobre os formatos

VOX é um formato de áudio sem cabecalho construído em torno da codificação Dialogic ADPCM, amplamente adotado em telefonia, sistemas de resposta de voz interativa (IVR) é plataformas de correio de voz desde os anos 1980. Cada amostra de áudio é comprimida em 4 bits usando um algoritmo desenvolvido pela Oki Electric é implementado em hardware nas placas de interface telefônica da Dialogic Corporation. Os arquivos VOX normalmente usam uma taxa de amostragem de 6000 ou 8000 Hz, produzindo gravações extremamente compactas otimizadas para inteligibilidade de fala em vez de fidelidade musical. Como o formato não carregá cabecalho, o software de reprodução deve conhecer a taxa de amostragem é os parâmetros de codificação antecipadamente — uma compensacao que reduz sobrecarga mas exige gerenciamento cuidadoso de arquivos. A principal vantagem do VOX é a eficiência de armazenamento: uma gravação de voz de um minuto a 8 kHz ocupa aproximadamente 240 KB, tornando-o prático para sistemas que armazenam milhares de prompts. O Dialogic ADPCM está em conformidade com o padrão ITU-T G.726, garantindo interoperabilidade entre equipamentos de telefonia de diferentes fornecedores. Mesmo enquanto call centers modernos migram para sistemas baseados em IP com codecs como Opus, vastas bibliotecas de gravações VOX persistem em implantacoes IVR legadas é acervos de conformidade em todo o mundo.
Desenvolvedor: Dialogic Corporation
Lançamento inicial: 1983
NIST SPHERE (SPeech HEader REsources) é um formato de arquivo de áudio especializado criado pelo National Institute of Standards and Technology para pesquisa em fala, particularmente projetos financiados pela DARPA. O formato envolve amostras de áudio brutas com um cabecalho ASCII estruturado codificando metadados como taxa de amostragem, contagem de canais, tipo de codificação, dados demograficos do falante é anotações de transcrição — tornando-o ideal para distribuição de corpora de fala. Os arquivos NIST normalmente armazenam PCM sem compressão ou áudio mu-law em taxas de amostragem de qualidade telefônica (8 kHz ou 16 kHz), embora o container seja flexível o suficiente para conter várias codificacoes. Uma vantagem chave é o cabecalho rico é autodescritivo que permite que pesquisadores incorporem metadados detalhados de corpus diretamente no arquivo, eliminando arquivos auxiliares. O SPHERE também se tornou o padrão de facto para grandes bancos de dados de fala como TIMIT, Switchboard é o corpus Fisher, garantindo amplo reconhecimento em laboratorios acadêmicos é governamentais. A especificação aberta é a disponibilidade de ferramentas de linha de comando (sphere, h_strip, w_decode) tornam simples converter, inspecionar é processar esses arquivos programaticamente em pipelines de processamento de fala.
Lançamento inicial: 1990

Perguntas Frequentes

Por que converter VOX para NIST?

NIST armazena áudio com metadados ricos para pesquisa de fala. Converter VOX integra dados de telefonia em fluxos de pesquisa acadêmica.

O que abre arquivos NIST?

O toolkit NIST SPHERE, SoX, Kaldi e HTK suportam formato NIST.

Como NIST difere de SPH?

São o mesmo formato. NIST é às vezes usado como extensão ou nome do formato; SPH é a extensão padrão.

NIST é usado no Kaldi?

Sim — Kaldi lê arquivos NIST SPHERE nativamente para treinamento e decodificação de reconhecimento de fala.

Posso adicionar metadados?

NIST suporta headers de metadados ricos em texto para info de locutor, condições de gravação e mais.

Classificação de qualidade VOX a NIST

5.0 (1 votos)
Você precisa converter e baixar pelo menos 1 arquivo para fornecer comentários!