Konwerter CDDA na SPH

Przekonwertuj audio CD na format mowy NIST SPH online

Upuść pliki tutaj. 1 GB Maksymalny rozmiar pliku lub Zapisz się
do
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Standard badawczy

Twórz pliki NIST Sphere z CDDA — format wymagany przez główne korpusy badań mowy takie jak TIMIT i Switchboard.

Na serwerze

Konwersja SPH odbywa się na naszych serwerach. Bez instalacji narzędzi NIST ani Kaldi — konwertuj CDDA na SPH z dowolnej przeglądarki.

Bezpieczna obsługa

Twoje przesłane pliki CDDA są usuwane po konwersji. Wyjścia SPH są kasowane z naszych serwerów automatycznie w ciągu 24 godzin.

Jak przekonwertować plik w formacie CDDA do formatu SPH

1

Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.

2

Wybierz format sph lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).

3

Poczekaj, aż plik zostanie przekonwertowany do formatu sph; od razu po konwersji możesz go pobrać.

O formatach

CDDA (Compact Disc Digital Audio), znany rowniez jako standard Red Book, definiuje format audio przechowywany na plytach muzycznych CD. Opracowany wspolnie przez Sony i Philips i opublikowany w 1980 roku, ustanowil parametry, ktore ksztaltowaly cyfrowe audio przez dziesieciolecia: 16-bitowe liniowe PCM przy 44,1 kHz stereo, dajace 1411,2 kbps nieskompresowanego strumienia. Kazda plyta moze pomiescic do 80 minut muzyki zorganizowanej w sciezki z punktami indeksowymi, danymi subkanalowymi do wyswietlania tekstu oraz kodami korekcji bledow (CIRC) zapewniajacymi niezawodne odtwarzanie mimo drobnych zarysowlan. Gdy audio jest zgrywane z plyty CD, wynikowy strumien jest czesto zapisywany z rozszerzeniem .cdda jako surowe PCM przed konwersja. Najbardziej oczywista zaleta jest nieskompresowana, bezstratna natura — to, co dociera do uszu sluchacza, jest matematycznie identyczne z masterem studyjnym przy danej rozdzielczosci. Solidna korekcja bledow zapewnia doskonala odpornosc, utrzymujac integralnosc audio nawet przy umiarkowanym zuzyciu powierzchni plyty. Sprzedawszy miliardy egzemplarzy od premiery pierwszego komercyjnego wydania w 1982 roku, CDDA ustalilo bazowe oczekiwania jakosciowe dla cyfrowej muzyki i pozostaje punktem odniesienia, wzgledem ktorego ocenia sie stratne kodeki.
Twórca: Sony / Philips
Pierwsze wydanie: Październik 1980
SPH to rozszerzenie plikow audio przechowywanych w formacie NIST SPHERE (SPeech HEader REsources) — standardzie stworzonym przez amerykanski National Institute of Standards and Technology okolo 1990 roku. Przeznaczony do badan nad mowa, pliki SPH zawieraja 1024-bajtowy naglowek ASCII wypelniony metadanymi — identyfikatorami bazy danych, liczba kanalow, czestotliwoscia probkowania, kolejnoscia bajtow i typem kompresji — co czyni kazde nagranie samoopisujoacy sie. Dane audio to zwykle 16-bitowe liniowe PCM probkowane przy 16 kHz, choc dozwolone sa inne konfiguracje. Badacze z NIST, DARPA i uniwersytetow na calym swiecie polegaja na SPH przy dystrybucji korpusow mowy, takich jak TIMIT, Switchboard i kolekcje LDC, ktore stanowia fundament nowoczesnych systemow automatycznego rozpoznawania mowy. Kluczowa zaleta jest to, ze czytelny naglowek pozwala skryptom parsowac metadane nagrania bez dekodowania binarnego. Scisla standaryzacja formatu eliminuje tez niejednoznacznosc przy wspoldzieleniu zbiorow danych miedzy instytucjami i platformami. Poniewaz pliki SPH przechowuja nieskompresowane PCM, zachowuja pelna wiernosc audio — co jest krytyczne przy trenowaniu modeli akustycznych, gdzie nawet drobne artefakty moga znieksztalcic wyniki.
Pierwsze wydanie: 1990

Często Zadawane Pytania

Dlaczego warto konwertować CDDA na SPH?

SPH (NIST Sphere) to standardowy format dystrybucji korpusów badań mowy. Konwersja CDDA na SPH czyni nagrania wykorzystywalnymi w środowisku akademickim.

Czym jest NIST Sphere?

Sphere to format zdefiniowany przez NIST do wymiany danych mowy w badaniach. Zawiera tekstowy nagłówek z metadanymi i dane audio PCM.

Jakie narzędzia odczytują SPH?

Narzędzia NIST SPH, SoX, Kaldi i HTK odczytują format Sphere. Większość frameworków do rozpoznawania mowy go obsługuje.

Czy SPH obsługuje jakość CD?

SPH może przechowywać audio o różnych częstotliwościach. Badania mowy zwykle używają 8-16 kHz, ale format radzi sobie z danymi CDDA 44,1 kHz.

Czy mogę konwertować zbiorczo?

Prześlij wiele plików CDDA i przekonwertuj je na SPH w jednej sesji — praktyczne do budowania zbiorów danych badań mowy z nagrań CD.