GSM naar NIST Converter

Codeer GSM-telefonie-audio naar NIST-spraakformaat online

Zet bestanden hier neer. 1 GB maximale bestandsgrootte of Aanmelden
naar
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Onderzoekskwaliteit

Bereid GSM-telefonieopnamen voor op spraakonderzoek door te converteren naar het NIST-formaat dat door academische analysetools wordt verwacht.

Geen toolkit nodig

Sla de installatie van SPHERE-tools over. Converteer GSM naar NIST volledig online via je webbrowser.

Privacybescherming

Alle GSM-uploads worden na conversie verwijderd. NIST-bestanden worden binnen 24 uur automatisch van de servers gewist.

Hoe converteert u een GSM naar NIST

1

Selecteer bestanden van Computer, Google Drive, Dropbox, URL of door ze te verslepen naar de pagina.

2

Kies nist of iedere andere bestandsindeling die u nodig heeft als resultaat (meer dan 200 indelingen worden ondersteund)

3

Laat het bestand converteren en u kunt direct daarna uw nist-bestand downloaden

Over de formaten

GSM 06.10 (Full Rate) is de fundamentele spraakcodec van de Global System for Mobile Communications-standaard, geratificeerd door ETSI in 1991 en ingezet bij honderden mobiele netwerken wereldwijd. Werkend op één vaste 13 kbit/s past het algoritme Regular Pulse Excitation with Long-Term Prediction (RPE-LTP) toe om frames van 20 ms 8 kHz mono-spraak te comprimeren tot slechts 33 bytes per frame. Deze aanpak modelleert het spraakkanaal als één lineair predictief filter, codeert het excitaitiesignaal en maakt gebruik van toonhoogteperiodiciteit voor verdere reductie — afgestemd op het leveren van verstaanbare spraak onder de bandbreedtebeperkingen van vroege digitale mobiele kanalen. De codec drijft niet alleen GSM-telefonie aan, maar ook veel VoIP-applicaties, voicemailsystemen en IVR-platforms die profiteren van de lage bitrate. Drie concrete voordelen springen eruit. Ten eerste buitengewone compressie: één minuut spraak past in ongeveer 100 KB, wat efficiënte opslag en transmissie mogelijk maakt. Ten tweede universele tooling — bibliotheken als libgsm en SoX verwerken codering en decodering op elk groot platform. Ten derde één royaltyvrij patentlandschap dat adoptie binnen opensourcetelefonie-projecten als Asterisk en FreeSWITCH heeft gestimuleerd.
Eerste release: 1991
NIST SPHERE (SPeech HEader REsources) is één gespecialiseerd audiobestandsformaat ontwikkeld door het National Institute of Standards and Technology voor spraakonderzoek, met name projecten gefinancierd door DARPA. Het formaat verpakt ruwe audiosamples met één gestructureerde ASCII-header die metadata codeert zoals samplefrequentie, kanaalaantal, coderingstype, demografische sprekergegevens en transcriptieannotaties — waardoor het ideaal is voor het distribueren van spraakcorpora. NIST-bestanden slaan doorgaans ongecomprimeerde PCM- of mu-law-audio op bij samplefrequenties op telefoniekwaliteit (8 kHz of 16 kHz), hoewel de container flexibel genoeg is voor verschillende coderingen. Één belangrijk voordeel is de rijke zelfdocumenterende header waarmee onderzoekers gedetailleerde corpusmetadata direct in het bestand kunnen inbedden, waardoor aparte bestanden overbodig worden. SPHERE is ook de de facto standaard geworden voor grote spraakdatabases zoals TIMIT, Switchboard en het Fisher-corpus, wat brede herkenning in academische en overheidslaboratoria garandeert. De open specificatie en beschikbaarheid van opdrachtregelhulpmiddelen (sphere, h_strip, w_decode) maken het eenvoudig om deze bestanden programmatisch te converteren, inspecteren en verwerken in spraakverw werkingspipelines.
Eerste release: 1990

Veel Gestelde Vragen

Wat is het NIST-formaat?

NIST is het spraakdataformaat van het National Institute of Standards and Technology, veel gebruikt in spraakonderzoek en benchmarks.

Waarom GSM naar NIST converteren?

Het NIST-formaat wordt verwacht door veel spraakherkenningsbenchmarks, onderzoekscorpora en academische tools die telefoniespraak verwerken.

Wat is het verschil tussen NIST en SPH?

NIST en SPH behoren beide tot de SPHERE-formaatfamilie. Ze zijn functioneel dezelfde standaard voor spraakonderzoek.

Welke onderzoekstools lezen NIST?

Kaldi, HTK, Praat en de officiële NIST SPHERE-toolkit ondersteunen allemaal NIST-bestanden voor spraakanalyse.

Is de conversie vertrouwelijk?

GSM-uploads worden na conversie gewist. NIST-resultaten worden binnen 24 uur van onze servers verwijderd.