Konwerter GSM na NIST

Zakoduj audio telefoniczne GSM do formatu mowy NIST online

Upuść pliki tutaj. 1 GB Maksymalny rozmiar pliku lub Zapisz się
do
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Format badawczy

Przygotuj nagrania telefoniczne GSM do badań nad mową, konwertując je do formatu NIST wymaganego przez akademickie narzędzia analityczne.

Bez instalacji narzędzi

Pomiń konfigurację narzędzi SPHERE na swoim komputerze. Konwertuj GSM na NIST całkowicie online w przeglądarce.

Prywatne przetwarzanie

Wszystkie przesłane pliki GSM są usuwane po konwersji. Pliki NIST są automatycznie kasowane z serwerów w ciągu 24 godzin.

Jak przekonwertować plik w formacie GSM do formatu NIST

1

Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.

2

Wybierz format nist lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).

3

Poczekaj, aż plik zostanie przekonwertowany do formatu nist; od razu po konwersji możesz go pobrać.

O formatach

GSM 06.10 (Full Rate) to podstawowy kodek mowy standardu Global System for Mobile Communications, ratyfikowany przez ETSI w 1991 roku i wdrozony w setkach sieci komorkowych na calym swiecie. Dzialajac przy stalym 13 kbit/s, algorytm stosuje wzbudzenie impulsami regularnymi z predykcja dlugoterminowa (RPE-LTP) do kompresji 20 ms ramek mowy monofonicznej 8 kHz do zaledwie 33 bajtow kazdej. Podejscie to modeluje trakt glosowy jako liniowy filtr predykcyjny, koduje sygnal wzbudzenia i wykorzystuje periodycznosc tonu podstawowego do dalszej redukcji — dostrojone, by dostarczac zrozumiala mowe w warunkach ograniczonej przepustowosci wczesnych cyfrowych kanalow mobilnych. Kodek zasila nie tylko telefonie GSM, ale rowniez wiele aplikacji VoIP, systemow poczty glosowej i platform IVR, ktore korzystaja z niskiego bitrate. Trzy konkretne zalety wyrózniaja GSM. Po pierwsze, nadzwyczajna kompresja: minuta mowy miesci sie w ok. 100 KB, umozliwiajac efektywne przechowywanie i transmisje. Po drugie, uniwersalne narzedzia — biblioteki takie jak libgsm i SoX obsluguja kodowanie i dekodowanie na kazdej wiekszej platformie. Po trzecie, krajobraz patentowy wolny od tantiem zachecil do adopcji w projektach telefonii open-source, takich jak Asterisk i FreeSWITCH.
Pierwsze wydanie: 1991
NIST SPHERE (SPeech HEader REsources) to specjalistyczny format plikow audio stworzony przez National Institute of Standards and Technology na potrzeby badan nad mowa, w szczegolnosci projektow finansowanych przez DARPA. Format opakowuje surowe probki audio w strukturalny naglowek ASCII kodujacy metadane, takie jak czestotliwosc probkowania, liczba kanalow, typ kodowania, dane demograficzne mowcy i adnotacje transkrypcyjne — co czyni go idealnym do dystrybucji korpusow mowy. Pliki NIST zwykle przechowuja nieskompresowane PCM lub audio mu-law przy czestotliwosciach probkowania klasy telefonicznej (8 kHz lub 16 kHz), choc kontener jest na tyle elastyczny, by pomiescic rozne kodowania. Kluczowa zaleta jest bogaty, samoopisujoacy sie naglowek, pozwalajacy badaczom osadzac szczegolowe metadane korpusowe bezposrednio w pliku, eliminujac potrzebe osobnych plikow towarzyszacych. SPHERE stal sie rowniez de facto standardem dla glownych baz danych mowy, takich jak TIMIT, Switchboard i korpus Fisher, zapewniajac szerokie uznanie w laboratoriach akademickich i rzadowych. Otwarta specyfikacja i dostepnosc narzedzi wiersza polecen (sphere, h_strip, w_decode) umozliwiaja latwa konwersje, inspekcje i przetwarzanie tych plikow programistycznie w potokach przetwarzania mowy.
Pierwsze wydanie: 1990

Często Zadawane Pytania

Czym jest format NIST?

NIST to format danych mowy opracowany przez National Institute of Standards and Technology, stosowany w badaniach nad mową i benchmarkach.

Dlaczego warto konwertować GSM na NIST?

Format NIST jest wymagany przez wiele narzędzi badawczych, korpora mowy i akademickich systemów analizy danych telefonicznych.

Czym NIST różni się od SPH?

NIST i SPH odnoszą się do rodziny formatów SPHERE. Funkcjonalnie to ten sam standard stosowany w badaniach nad mową.

Jakie narzędzia odczytują NIST?

Kaldi, HTK, Praat oraz oficjalny zestaw narzędzi NIST SPHERE obsługują pliki NIST do analizy mowy.

Czy konwersja jest poufna?

Przesłane pliki GSM są usuwane po konwersji. Pliki NIST są kasowane z naszych serwerów w ciągu 24 godzin.