Konverter VOX ke SPH

Konversi Dialogic VOX ke format NIST SPHERE

Taruh file di sini. 1 GB Ukuran file maksimum atau Daftar
untuk
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Siap Korpus Penelitian

NIST SPHERE adalah standar untuk data penelitian suara. Rekaman telefoni VOX Anda menjadi materi pelatihan.

Telefoni ke Penelitian

Audio call center nyata dalam format penelitian — berharga untuk membangun model pengenalan suara khusus telefoni.

Pemrosesan Massal

Konversi seluruh koleksi rekaman VOX ke SPH untuk pembangunan korpus.

Bagaimana cara mengubah VOX ke SPH

1

Pilih file dari Komputer, Google Drive, Dropbox, URL, atau dengan menyeret ke halaman ini.

2

Pilih sph atau format lainnya yang Anda inginkan (mendukung lebih dari 200 format)

3

Tunggu proses konversi selesai dan Anda dapat mengunduh sph setelahnya

Tentang format

VOX adalah format audio tanpa header yang dibangun di sekitar encoding Dialogic ADPCM, diadopsi secara luas dalam telepon, sistem interactive voice response (IVR), dan platform pesan suara sejak tahun 1980-an. Setiap sampel audio dikompresi menjadi 4 bit menggunakan algoritma yang dikembangkan oleh Oki Electric dan diimplementasikan dalam perangkat keras pada kartu antarmuka telepon Dialogic Corporation. File VOX biasanya menggunakan sampling rate 6000 atau 8000 Hz, menghasilkan rekaman yang sangat kompak yang dioptimalkan untuk kejelasan ucapan daripada fidelitas musik. Karena format ini tidak membawa header, perangkat lunak pemutaran harus mengetahui sample rate dan parameter encoding terlebih dahulu — trade-off yang mengurangi overhead tetapi memerlukan manajemen file yang cermat. Keunggulan utama VOX adalah efisiensi penyimpanan: rekaman suara satu menit pada 8 kHz hanya memakan sekitar 240 KB, membuatnya praktis untuk sistem yang menyimpan ribuan prompt. Dialogic ADPCM sesuai dengan standar ITU-T G.726, memastikan interoperabilitas di seluruh peralatan telepon dari vendor yang berbeda. Meskipun pusat panggilan modern bermigrasi ke sistem berbasis IP dengan codec seperti Opus, perpustakaan besar rekaman VOX tetap ada dalam deployment IVR warisan dan arsip kepatuhan di seluruh dunia.
Rilis awal: 1983
SPH adalah ekstensi file untuk audio yang disimpan dalam format NIST SPHERE (SPeech HEader REsources), standar yang dibuat oleh National Institute of Standards and Technology Amerika Serikat sekitar tahun 1990. Dibangun untuk penelitian ucapan, file SPH membawa header ASCII 1024-byte yang dipenuhi metadata — pengidentifikasi database, jumlah channel, sample rate, pengurutan byte, dan tipe kompresi — membuat setiap rekaman mendeskripsikan dirinya sendiri. Audio yang mendasari biasanya PCM linear 16-bit yang disampling pada 16 kHz, meskipun konfigurasi lain diperbolehkan. Peneliti di NIST, DARPA, dan universitas di seluruh dunia mengandalkan SPH untuk mendistribusikan korpora ucapan seperti TIMIT, Switchboard, dan koleksi LDC yang mendasari sistem pengenalan ucapan otomatis modern. Keunggulan utamanya adalah header yang dapat dibaca manusia memungkinkan skrip mengurai metadata rekaman tanpa decoding biner. Standardisasi format yang ketat juga menghilangkan ambiguitas saat berbagi dataset di seluruh institusi dan platform. Karena file SPH menyimpan PCM tanpa kompresi, mereka mempertahankan fidelitas audio penuh — kritis saat melatih model akustik di mana bahkan artefak kecil dapat menyebabkan hasil yang menyimpang.
Rilis awal: 1990

Pertanyaan yang Sering Diajukan

Mengapa mengonversi VOX ke SPH?

SPHERE adalah standar untuk korpus penelitian suara. Mengonversi VOX membuat data pelatihan telefoni untuk pengenalan suara.

Apa yang bisa membuka file SPH?

Alat NIST SPHERE, SoX, HTK, dan Kaldi membaca file SPH.

Apakah audio telefoni VOX bagus untuk penelitian?

Audio telefoni dunia nyata berharga untuk melatih pengenalan suara — mewakili kondisi panggilan aktual.

Bisakah saya batch-konversi untuk pembangunan korpus?

Unggah beberapa file VOX dan konversi ke SPH secara bersamaan — efisien untuk membangun korpus suara telefoni.

Apakah SPH sama dengan NIST?

Ya — SPH adalah ekstensi file, NIST merujuk pada organisasi asal.