Konwerter VOC na NIST

Zapisz nagrania Sound Blaster VOC w formacie NIST

Upuść pliki tutaj. 1 GB Maksymalny rozmiar pliku lub Zapisz się
do
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Integracja badawcza

NIST to standardowy kontener dla korpusów mowy. Konwersja VOC na NIST integruje nagrania Sound Blaster w potoki badawcze.

Przetwarzanie wsadowe

Buduj korpusy mowy efektywnie — wgraj wiele plików VOC i wyprodukuj wyniki NIST dla wszystkich w jednej sesji.

Prywatnie i bezpiecznie

Audio badawcze często zawiera wrażliwe dane mowy. Wgrane pliki VOC usuwane natychmiast, wyniki NIST w ciągu 24 godzin.

Jak przekonwertować plik w formacie VOC do formatu NIST

1

Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.

2

Wybierz format nist lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).

3

Poczekaj, aż plik zostanie przekonwertowany do formatu nist; od razu po konwersji możesz go pobrać.

O formatach

VOC (Creative Voice) to kontener cyfrowego audio opracowany przez Creative Technology i wprowadzony wraz z oryginalna karta Sound Blaster w 1989 roku. Sluzyl jako natywny format audio dla rodziny Sound Blaster w epoce DOS, kiedy sprzet Creative dominowal w dziedzie PC audio. Pliki VOC sa oparte na blokach: kazdy plik sklada sie z typowanych blokow danych, ktore moga przenosic 8-bitowe PCM bez znaku, 4-bitowe i 2,6-bitowe Creative ADPCM, 16-bitowe PCM ze znakiem, a takze audio zakodowane w A-law i mu-law. Struktura blokowa obsluguje rowniez interwaly ciszy, petle powtorzen i punkty znacznikowe, dajac twoorcom gier precyzyjna kontrole nad odtwarzaniem dzwieku. Istotna zaleta bylo dekodowanie na poziomie sprzetu — karty Sound Blaster mogly odtwarzac dane VOC bezposrednio przez transfer DMA, zwalniajac procesor do innych zadan w epoce, gdy cykle procesora byly na wage zlota. Format byl szeroko stosowany w grach DOS od id Software, Sierra i LucasArts. Wraz z rozwojem Windowsa i formatu WAV VOC stopniowo wypadl z glownego nurtu, lecz pozostaje wazny dla zachowania retro gier i dla kazdego, kto pracuje z archiwalnymi zbiorami audio z ery PC.
Pierwsze wydanie: 1989
NIST SPHERE (SPeech HEader REsources) to specjalistyczny format plikow audio stworzony przez National Institute of Standards and Technology na potrzeby badan nad mowa, w szczegolnosci projektow finansowanych przez DARPA. Format opakowuje surowe probki audio w strukturalny naglowek ASCII kodujacy metadane, takie jak czestotliwosc probkowania, liczba kanalow, typ kodowania, dane demograficzne mowcy i adnotacje transkrypcyjne — co czyni go idealnym do dystrybucji korpusow mowy. Pliki NIST zwykle przechowuja nieskompresowane PCM lub audio mu-law przy czestotliwosciach probkowania klasy telefonicznej (8 kHz lub 16 kHz), choc kontener jest na tyle elastyczny, by pomiescic rozne kodowania. Kluczowa zaleta jest bogaty, samoopisujoacy sie naglowek, pozwalajacy badaczom osadzac szczegolowe metadane korpusowe bezposrednio w pliku, eliminujac potrzebe osobnych plikow towarzyszacych. SPHERE stal sie rowniez de facto standardem dla glownych baz danych mowy, takich jak TIMIT, Switchboard i korpus Fisher, zapewniajac szerokie uznanie w laboratoriach akademickich i rzadowych. Otwarta specyfikacja i dostepnosc narzedzi wiersza polecen (sphere, h_strip, w_decode) umozliwiaja latwa konwersje, inspekcje i przetwarzanie tych plikow programistycznie w potokach przetwarzania mowy.
Pierwsze wydanie: 1990

Często Zadawane Pytania

Dlaczego warto konwertować VOC na NIST?

NIST przechowuje audio z nagłówkami metadanych dla badań mowy. Integruje legacy audio w akademickie przepływy badań lingwistycznych.

Co otwiera pliki NIST?

Zestaw narzędzi NIST SPHERE i SoX odczytują NIST. Frameworki rozpoznawania mowy jak Kaldi i HTK również obsługują ten format natywnie.

Czym NIST różni się od WAV?

NIST używa tekstowego nagłówka z bogatymi polami metadanych — znacznie bardziej opisowy niż binarny nagłówek używany przez pliki WAV.

Czy NIST jest używany w Kaldi?

Tak. Kaldi, jeden z najpopularniejszych zestawów narzędzi do rozpoznawania mowy, bezpośrednio odczytuje pliki NIST SPHERE do trenowania i dekodowania.

Czy mogę wsadowo konwertować pliki VOC?

Wgraj wszystkie nagrania VOC i konwertuj je na NIST jednocześnie — efektywne przy budowaniu korpusu mowy z wielu źródeł.