Konwerter NIST na HTK

Konwersja audio NIST na HTK w przeglądarce

Upuść pliki tutaj. 1 GB Maksymalny rozmiar pliku lub Zapisz się
do
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Prywatność i bezpieczeństwo

Pliki NIST są usuwane natychmiast po konwersji, a wyniki HTK są kasowane z serwerów w ciągu 24 godzin.

Dokładne wyniki

Konwersja NIST na HTK zachowuje wierność audio. Nagrania są przetwarzane z zachowaniem dokładnych danych próbek.

Dowolne urządzenie

Uruchom konwerter NIST na HTK na dowolnym systemie operacyjnym przez przeglądarkę — komputer, laptop, tablet lub smartfon.

Jak przekonwertować plik w formacie NIST do formatu HTK

1

Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.

2

Wybierz format htk lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).

3

Poczekaj, aż plik zostanie przekonwertowany do formatu htk; od razu po konwersji możesz go pobrać.

O formatach

NIST SPHERE (SPeech HEader REsources) to specjalistyczny format plikow audio stworzony przez National Institute of Standards and Technology na potrzeby badan nad mowa, w szczegolnosci projektow finansowanych przez DARPA. Format opakowuje surowe probki audio w strukturalny naglowek ASCII kodujacy metadane, takie jak czestotliwosc probkowania, liczba kanalow, typ kodowania, dane demograficzne mowcy i adnotacje transkrypcyjne — co czyni go idealnym do dystrybucji korpusow mowy. Pliki NIST zwykle przechowuja nieskompresowane PCM lub audio mu-law przy czestotliwosciach probkowania klasy telefonicznej (8 kHz lub 16 kHz), choc kontener jest na tyle elastyczny, by pomiescic rozne kodowania. Kluczowa zaleta jest bogaty, samoopisujoacy sie naglowek, pozwalajacy badaczom osadzac szczegolowe metadane korpusowe bezposrednio w pliku, eliminujac potrzebe osobnych plikow towarzyszacych. SPHERE stal sie rowniez de facto standardem dla glownych baz danych mowy, takich jak TIMIT, Switchboard i korpus Fisher, zapewniajac szerokie uznanie w laboratoriach akademickich i rzadowych. Otwarta specyfikacja i dostepnosc narzedzi wiersza polecen (sphere, h_strip, w_decode) umozliwiaja latwa konwersje, inspekcje i przetwarzanie tych plikow programistycznie w potokach przetwarzania mowy.
Pierwsze wydanie: 1990
HTK to natywny kontener fal dzwiekowych dla Hidden Markov Model Toolkit — pakietu oprogramowania opracowanego na Wydziale Inzynierii Uniwersytetu Cambridge do badan nad rozpoznawaniem mowy. Po raz pierwszy udostepniony w 1993 roku, HTK szybko stal sie platforma referencyjnaw laboratoriach lingwistyki obliczeniowej na calym swiecie, a jego format plikow poszedl w jego slady. Kazdy plik przechowuje sekwencje wektorow parametrow lub surowe probki, poprzedzone 12-bajtowym naglowkiem okreslajacym liczbe ramek, okres ramki w jednostkach 100 ns, liczbe bajtow na ramke oraz kod typu wskazujacy rodzaj danych — opcje obejmuja zarowno przebieg PCM, jak i wspolczynniki mel-czestotliwosciowe oraz energie pasma filtrowego. Ta wszechstronnosc pozwala pojedynczemu kontenerowi przenosic zarowno zrodlowe audio, jak i wyekstrahowane cechy bez zmiany parserow. Celowo minimalny naglowek unika wyrownan paddingu czy opcjonalnych blokow, co czyni format trywialnym do odczytu z C, Pythona czy MATLAB-a za pomoca kilku linii binarnego I/O. Trzy zalety stanowia o trwalym znaczeniu HTK: scisla integracja z potokiem trenowania i rozpoznawania HTK, deterministyczny uklad bajtow eliminujacy niejednoznacznosc parsera oraz szerokie przyjecie w korpusach akademickich.
Pierwsze wydanie: 1993

Często Zadawane Pytania

Dlaczego warto konwertować NIST na HTK?

NIST SPHERE i HTK oba służą badaniom mowy, ale różnią się ekosystemami narzędzi. Format HTK integruje się z zestawem narzędzi do rozpoznawania mowy HTK.

Jakie programy otwierają pliki HTK?

Pliki HTK można otworzyć w zestawie narzędzi do rozpoznawania mowy HTK, SoX lub narzędziach badawczych do analizy mowy.

Czy potrzebuję specjalnego oprogramowania?

Wcale nie. Konwersja odbywa się online — wystarczy otworzyć przeglądarkę, wgrać plik NIST i pobrać wynik HTK.

Ile trwa konwersja NIST na HTK?

Konwersja jest szybka — zazwyczaj kilka sekund dla standardowych nagrań NIST. Większe pliki mogą wymagać nieco więcej czasu.

Na jakich platformach działa konwersja NIST na HTK?

Działa na wszystkich platformach. Otwórz konwerter w Chrome, Firefox, Safari lub Edge na dowolnym komputerze lub urządzeniu mobilnym.

Czy mogę dostosować ustawienia audio?

Tak. Możesz skonfigurować częstotliwość próbkowania, głębię bitową i liczbę kanałów przed rozpoczęciem konwersji NIST na HTK.