Convertidor de CDDA a SPH

Convierte audio de CD al formato de habla NIST SPH en línea

Suelte los archivos aquí. 1 GB tamaño máximo de archivo o Registrarse
a
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Estándar de investigación

Produce archivos NIST Sphere desde CDDA — el formato requerido por los principales corpus de investigación de habla como TIMIT y Switchboard.

Basado en servidor

La conversión SPH se ejecuta en nuestros servidores. Sin necesidad de instalar herramientas NIST o Kaldi — convierte CDDA a SPH desde cualquier navegador.

Manejo seguro

Tus archivos CDDA subidos se eliminan tras la conversión. Las salidas SPH se eliminan de nuestros servidores en 24 horas automáticamente.

Cómo convertir de CDDA a SPH

1

Seleccione los archivos desde el ordenador, Google Drive, Dropbox o agregue una URL. También puede simplemente arrastrarlo a esta página..

2

Elija sph o cualquier otro formato de salida deseado (más de 200 formatos compatibles)

3

Cuando su archivo está convertido, puede guardar archivo sph inmediatamente

Sobre los formatos

CDDA (Compact Disc Digital Audio), conocido como el estándar Red Book, define el audio almacenado en CDs de música. Desarrollado conjuntamente por Sony y Philips y publicado en 1980, estableció parámetros qué moldearon el audio digital durante décadas: PCM lineal de 16 bits a 44.1 kHz en estéreo, produciendo 1,411.2 kbps sin comprimir. Cada disco puede almacenar hasta 80 minutos organizados en pistas con puntos de indice, datos de subcanal para visualización de texto y codigos de corrección de errores (CIRC) qué aseguran una reproducción fiable a pesar de rayones menores. Cuando el audio se extrae de un CD, el flujo resultante a menudo se guarda con la extensión .cdda como PCM en bruto antes de la conversión. La ventaja más evidente es su naturaleza sin compresión y sin pérdida — lo qué llega a los oidos es matematicamente idéntico al máster de estudio a la resolución especificada. La robusta corrección de errores proporciona una excelente resistencia, manteniendo la integridad del audio incluso cuando las superficies del disco sufren un desgaste moderado. Habiendo vendido miles de millones de unidades desde el primer lanzamiento comercial en 1982, CDDA estableció las expectativas de calidad base para la música digital y sigue siendo la referencia con la qué se miden los códecs comprimidos.
Desarrollador: Sony / Philips
Lanzamiento inicial: Octubre 1980
SPH es la extensión de archivo para audio almacenado en el formato NIST SPHERE (SPeech HEader REsources), un estándar creado por el Instituto Nacional de Estándares y Tecnología de EE.UU. alrededor de 1990. Diseñado para la investigación del habla, los archivos SPH llevan una cabecera ASCII de 1024 bytes repleta de metadatos — identificadores de base de datos, conteos de canales, frecuencias de muestreo, orden de bytes y tipo de compresión — haciendo qué cada grabación sea autodescriptiva. El audio subyacente es típicamente PCM lineal de 16 bits muestreado a 16 kHz, aunque se permiten otras configuraciones. Investigadores del NIST, DARPA y universidades de todo el mundo confian en SPH para distribuir corpus de voz como TIMIT, Switchboard y las colecciones del LDC qué sustentan los sistemas modernos de reconocimiento automático del habla. Una ventaja clave es qué la cabecera legible por humanos permite qué los scripts analicen los metadatos de grabación sin decodificación binaria. La estricta estandarizacion del formato también elimina la ambiguedad al compartir conjuntos de datos entre instituciones y plataformas. Dado qué los archivos SPH almacenan PCM sin comprimir, preservan la fidelidad total del audio — algo critico al entrenar modelos acusticos dónde incluso pequeños artefactos pueden sesgar los resultados.
Lanzamiento inicial: 1990

Preguntas frecuentes

¿Por qué convertir CDDA a SPH?

SPH (NIST Sphere) es el formato estándar para distribuir corpus de investigación de habla. Convertir CDDA a SPH hace las grabaciones utilizables en el ámbito académico.

¿Qué es NIST Sphere?

Sphere es un formato definido por NIST para el intercambio de datos de habla en investigación. Incluye un encabezado de texto con metadatos y datos de audio PCM.

¿Qué herramientas leen SPH?

Las herramientas NIST SPH, SoX, Kaldi y HTK pueden leer el formato Sphere. La mayoría de los frameworks de investigación de reconocimiento de habla lo soportan.

¿SPH soporta calidad CD?

SPH puede almacenar audio a varias frecuencias. La investigación de habla típicamente usa 8-16 kHz, pero el formato maneja datos CDDA de 44,1 kHz también.

¿Puedo convertir en lote?

Sube múltiples archivos CDDA y conviértelos a SPH en una sesión — práctico para construir conjuntos de datos de investigación de habla a partir de grabaciones de CD.