Convertidor de SPX a SPH

Convierte audio Speex al formato SPH de cabecera de voz NIST en línea

Suelte los archivos aquí. 1 GB tamaño máximo de archivo o Registrarse
a
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Formato para corpus de voz

Convierte grabaciones SPX al formato NIST SPHERE — el estándar de referencia para distribuir conjuntos de datos de investigación del habla a nivel mundial.

Compatible con investigación

Los archivos SPH funcionan con Kaldi, HTK, Praat y todos los principales kits de procesamiento del habla utilizados en PNL e investigación acústica.

Privacidad de datos

Los archivos SPX subidos se eliminan tras la conversión. Los resultados SPH se borran de los servidores en 24 horas.

Cómo convertir de SPX a SPH

1

Seleccione los archivos desde el ordenador, Google Drive, Dropbox o agregue una URL. También puede simplemente arrastrarlo a esta página..

2

Elija sph o cualquier otro formato de salida deseado (más de 200 formatos compatibles)

3

Cuando su archivo está convertido, puede guardar archivo sph inmediatamente

Sobre los formatos

Speex es un códec de audio de código abierto diseñado específicamente para la compresión de voz, desarrollado por Jean-Marc Valin bajo la Xiph.Org Foundation. Lanzado por primera vez en octubre de 2002, se enfoca en voz sobre IP, videoconferencias y cualquier escenario dónde la palabra hablada necesite transmitirse eficientemente a través de una red. Los archivos SPX envuelven audio codificado con Speex dentro de un contenedor Ogg, combinando la optimizacion del códec para voz con las capacidades de streaming de Ogg. Se admiten tres frecuencias de muestreo — banda estrecha a 8 kHz, banda ancha a 16 kHz y banda ultra ancha a 32 kHz — junto con codificación de tasa de bits variable qué se adapta en tiempo real a la complejidad del habla. Una ventaja sobresaliente es su naturaleza libre de patentes y licenciada bajo BSD, lo qué permitio a los desarrolladores incorporarlo libremente en productos tanto comerciales como de código abierto. Speex también incluye cancelacion de eco acustico, supresion de ruido y control automático de ganancia, funciones qué los códecs rivales típicamente delegan a bibliotecas externas. Aunque sus creadores recomiendan oficialmente Opus como sucesor desde 2012, Speex permanece desplegado en sistemas VoIP heredados, grabaciones archivadas y dispositivos embebidos dónde su decodificador ligero sigue siendo valorado.
Desarrollador: Xiph.Org Foundation
Lanzamiento inicial: 15 de octubre de 2002
SPH es la extensión de archivo para audio almacenado en el formato NIST SPHERE (SPeech HEader REsources), un estándar creado por el Instituto Nacional de Estándares y Tecnología de EE.UU. alrededor de 1990. Diseñado para la investigación del habla, los archivos SPH llevan una cabecera ASCII de 1024 bytes repleta de metadatos — identificadores de base de datos, conteos de canales, frecuencias de muestreo, orden de bytes y tipo de compresión — haciendo qué cada grabación sea autodescriptiva. El audio subyacente es típicamente PCM lineal de 16 bits muestreado a 16 kHz, aunque se permiten otras configuraciones. Investigadores del NIST, DARPA y universidades de todo el mundo confian en SPH para distribuir corpus de voz como TIMIT, Switchboard y las colecciones del LDC qué sustentan los sistemas modernos de reconocimiento automático del habla. Una ventaja clave es qué la cabecera legible por humanos permite qué los scripts analicen los metadatos de grabación sin decodificación binaria. La estricta estandarizacion del formato también elimina la ambiguedad al compartir conjuntos de datos entre instituciones y plataformas. Dado qué los archivos SPH almacenan PCM sin comprimir, preservan la fidelidad total del audio — algo critico al entrenar modelos acusticos dónde incluso pequeños artefactos pueden sesgar los resultados.
Lanzamiento inicial: 1990

Preguntas frecuentes

¿Por qué convertir SPX a SPH?

SPH (NIST SPHERE) es el formato estándar para corpus de investigación del habla. Convertir desde SPX prepara las grabaciones para estudios lingüísticos y acústicos.

¿Qué es NIST SPHERE?

SPHERE (SPeech HEader Resources) fue desarrollado por NIST para la distribución estandarizada de datos de voz en comunidades de investigación.

¿Qué herramientas funcionan con SPH?

El kit de herramientas NIST SPHERE, HTK, Kaldi, Praat y los principales marcos de procesamiento del habla manejan archivos SPH de forma nativa.

¿Se usa SPH en reconocimiento de voz?

Sí — la mayoría de los grandes corpus de voz (TIMIT, Switchboard, etc.) se distribuyen en formato SPH para entrenar modelos de reconocimiento.

¿Es gratuita la conversión?

Sí — gratuita en convertio.cloud para uso estándar.