Conversor de HCOM para SPH

Codifique áudio HCOM como formato de fala SPH do NIST online

Solte os arquivos aqui. 1 GB tamanho máximo do ficheiro ou Registar-se
para
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Padrão de Investigação de Fala

Converta HCOM para SPH — o formato padrão para corpora de fala NIST, investigação linguística e dados de treino de reconhecimento de fala.

Baseado na Nuvem

Sem necessidade de ferramentas NIST localmente. Converta HCOM para SPH diretamente do navegador nos nossos servidores na nuvem.

Limpeza Automática

Os uploads HCOM são eliminados após o processamento. Os ficheiros SPH são limpos dos servidores em 24 horas.

Como converter HCOM para SPH

1

Selecione os arquivos do seu computador, Google Drive, Dropbox ou adicione um URL. Você também pode simplesmente arrastá-lo para esta página.

2

Escolha sph ou qualquer outro formato de saída desejado (mais de 200 formatos compatíveis)

3

Espere o arquivo ser convertido e você poderá, então, baixar o seu arquivo sph

Sobre os formatos

HCOM é um formato de áudio codificado com Huffman da era inicial do Macintosh, projetado para encolher som digitalizado para distribuição em disquetes é sistemas de BBS quando o armazenamento era precioso é os modems eram lentos. O codificador recebe entrada PCM de 8 bits não assinado, calcula uma tabela de frequência de valores delta de amostra é constroi uma árvore de Huffman ótima que substitui deltas comuns por sequências curtas de bits. Taxas de compressão de 2:1 ou melhores eram típicas para gravações de fala, uma economia significativa quando um disquete de 3,5 polegadas comportava apenas 800 KB. Os arquivos eram distribuidos como resource forks do Macintosh é reproduzidos por utilitários como SoundApp é o ecossistema BinHex que definia a troca de software Mac no final dos anos 1980. O formato suportava taxas de amostragem de até 22,255 kHz, correspondendo às capacidades de saída do hardware de som do Macintosh original. Ferramentas como SoX mantém suporte a decodificação HCOM, garantindo que gravações arquivadas permaneçam acessíveis décadas depois. O HCOM possui três vantagens práticas para trabalho de preservação: compressão sem perdas que recupera às amostras originais exatamente, uma tabela Huffman auto-contida embutida em cada arquivo para decodificação sem dependências é prevalencia historica em milhares de arquivos de som vintage do Mac.
Desenvolvedor: Apple Computer
Lançamento inicial: 1985
SPH é a extensão de arquivo para áudio armazenado no formato NIST SPHERE (SPeech HEader REsources), um padrão criado pelo National Institute of Standards and Technology dos EUA por volta de 1990. Construído para pesquisa em fala, os arquivos SPH carregam um cabecalho ASCII de 1024 bytes repleto de metadados — identificadores de banco de dados, contagens de canais, taxas de amostragem, ordenacao de bytes é tipo de compressão — tornando cada gravação autodescritiva. O áudio subjacente é tipicamente PCM linear de 16 bits amostrado a 16 kHz, embora outras configurações sejam permitidas. Pesquisadores do NIST, DARPA é universidades em todo o mundo confiam no SPH para distribuir corpora de fala como TIMIT, Switchboard é às coleções LDC que sustentam os modernos sistemas de reconhecimento automático de fala. Uma vantagem chave é que o cabecalho legível por humanos permite que scripts analisem metadados de gravação sem decodificação binária. A padronizacao rigorosa do formato também elimina ambiguidade ao compartilhar conjuntos de dados entre instituições é plataformas. Como os arquivos SPH armazenam PCM sem compressão, eles preservam a fidelidade total do áudio — critico ao treinar modelos acusticos onde até pequenos artefatos podem distorcer os resultados.
Lançamento inicial: 1990

Perguntas Frequentes

O que é SPH?

SPH (SPHERE) é o formato SPeech HEader Resources criado pelo NIST para investigação de fala. É o padrão para corpora linguísticos em todo o mundo.

Porquê converter HCOM para SPH?

Para projetos de investigação de fala que necessitam de áudio no formato NIST SPHERE. Converter HCOM permite análise com ferramentas linguísticas padrão.

Que ferramentas usam SPH?

HTK, Kaldi, ferramentas de pontuação NIST e muitos frameworks de investigação em reconhecimento de fala suportam o formato SPH nativamente.

O SPH é apenas PCM com cabeçalhos?

Essencialmente sim. O SPH envolve áudio PCM com um cabeçalho baseado em texto contendo metadados sobre as condições e conteúdo da gravação.

A conversão é privada?

Os uploads HCOM são apagados após o processamento. Os resultados SPH são eliminados dos servidores em 24 horas.