Konverter CDDA ke SPH

Konversi audio CD ke format pidato NIST SPH secara online

Taruh file di sini. 1 GB Ukuran file maksimum atau Daftar
untuk
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Standar Riset

Hasilkan file NIST Sphere dari CDDA — format yang diperlukan oleh korpus riset pidato utama seperti TIMIT dan Switchboard.

Berbasis Server

Konversi SPH berjalan di server kami. Tidak perlu NIST tools atau instalasi Kaldi — konversi CDDA ke SPH dari browser mana pun.

Penanganan Aman

Upload CDDA Anda dihapus setelah konversi. Output SPH dihapus dari server kami dalam 24 jam secara otomatis.

Bagaimana cara mengubah CDDA ke SPH

1

Pilih file dari Komputer, Google Drive, Dropbox, URL, atau dengan menyeret ke halaman ini.

2

Pilih sph atau format lainnya yang Anda inginkan (mendukung lebih dari 200 format)

3

Tunggu proses konversi selesai dan Anda dapat mengunduh sph setelahnya

Tentang format

CDDA (Compact Disc Digital Audio), dikenal sebagai standar Red Book, mendefinisikan audio yang disimpan pada CD musik. Dikembangkan bersama oleh Sony dan Philips dan dipublikasikan pada tahun 1980, standar ini menetapkan parameter yang membentuk audio digital selama beberapa dekade: PCM linear 16-bit pada 44.1 kHz stereo, menghasilkan 1.411,2 kbps tanpa kompresi. Setiap disc dapat menampung hingga 80 menit yang diorganisasi dalam track dengan titik indeks, data sub-channel untuk tampilan teks, dan kode koreksi kesalahan (CIRC) yang memastikan pemutaran yang andal meskipun ada goresan kecil. Ketika audio di-rip dari CD, stream yang dihasilkan sering disimpan dengan ekstensi .cdda sebagai PCM mentah sebelum dikonversi. Keunggulan paling jelas adalah sifatnya yang tanpa kompresi dan lossless — apa yang sampai ke telinga Anda secara matematis identik dengan master studio pada resolusi yang ditentukan. Koreksi kesalahan yang kuat memberikan ketahanan yang sangat baik, mempertahankan integritas audio bahkan ketika permukaan disc mengalami keausan sedang. Setelah menjual miliaran unit sejak rilis komersial pertama pada tahun 1982, CDDA menetapkan ekspektasi kualitas dasar untuk musik digital dan tetap menjadi referensi pembanding bagi codec terkompresi.
Pengembang: Sony / Philips
Rilis awal: Oktober 1980
SPH adalah ekstensi file untuk audio yang disimpan dalam format NIST SPHERE (SPeech HEader REsources), standar yang dibuat oleh National Institute of Standards and Technology Amerika Serikat sekitar tahun 1990. Dibangun untuk penelitian ucapan, file SPH membawa header ASCII 1024-byte yang dipenuhi metadata — pengidentifikasi database, jumlah channel, sample rate, pengurutan byte, dan tipe kompresi — membuat setiap rekaman mendeskripsikan dirinya sendiri. Audio yang mendasari biasanya PCM linear 16-bit yang disampling pada 16 kHz, meskipun konfigurasi lain diperbolehkan. Peneliti di NIST, DARPA, dan universitas di seluruh dunia mengandalkan SPH untuk mendistribusikan korpora ucapan seperti TIMIT, Switchboard, dan koleksi LDC yang mendasari sistem pengenalan ucapan otomatis modern. Keunggulan utamanya adalah header yang dapat dibaca manusia memungkinkan skrip mengurai metadata rekaman tanpa decoding biner. Standardisasi format yang ketat juga menghilangkan ambiguitas saat berbagi dataset di seluruh institusi dan platform. Karena file SPH menyimpan PCM tanpa kompresi, mereka mempertahankan fidelitas audio penuh — kritis saat melatih model akustik di mana bahkan artefak kecil dapat menyebabkan hasil yang menyimpang.
Rilis awal: 1990

Pertanyaan yang Sering Diajukan

Mengapa mengonversi CDDA ke SPH?

SPH (NIST Sphere) adalah format standar untuk mendistribusikan korpus riset pidato. Konversi CDDA ke SPH membuat rekaman dapat digunakan dalam dunia akademis.

Apa itu NIST Sphere?

Sphere adalah format yang didefinisikan oleh NIST untuk pertukaran data pidato dalam riset. Mencakup header teks dengan metadata dan data audio PCM.

Alat apa yang membaca SPH?

NIST SPH tools, SoX, Kaldi, dan HTK dapat membaca format Sphere. Sebagian besar framework riset pengenalan suara mendukungnya.

Apakah SPH mendukung kualitas CD?

SPH dapat menyimpan audio pada berbagai rate. Riset pidato biasanya menggunakan 8-16 kHz, tetapi format ini juga menangani data CDDA 44,1 kHz.

Bisakah saya batch konversi?

Unggah beberapa file CDDA dan konversi ke SPH dalam satu sesi — praktis untuk membangun dataset riset pidato dari rekaman CD.