NIST - HTK Dönüştürücü

Tarayıcı tabanlı NIST - HTK ses dönüştürme

Dosyaları buraya bırakın. 1 GB maksimum dosya boyutu veya Kaydol
için
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Gizlilik ve Güvenlik

NIST dosyalarınız dönüştürmeden hemen sonra silinir ve HTK çıktıları sunucularımızdan 24 saat içinde kaldırılır.

Doğru Sonuçlar

NIST - HTK dönüştürme sürecinde ses sadakati korunur. Kayıtlarınız doğru örnek verileriyle temiz şekilde aktarılır.

Her Cihazda

NIST - HTK dönüştürücüyü web tarayıcınız aracılığıyla istediğiniz işletim sisteminde kullanın — masaüstü, dizüstü, tablet veya akıllı telefon.

NIST'i HTK'ye dönüştürme yöntemi

1

Dosyaları bilgisayar, Google Drive, Dropbox, URL'den veya sayfa üzerinden sürükleyerek seçin.

2

htk ya da sonuç olarak ihtiyacınız olan diğer formatlardan birini seçin (200'den fazla format desteklenir)

3

Haydi dosyayı dönüştürün ve htk dosyanızı hemen sonra indirebilirsiniz

Formatlar hakkında

NIST SPHERE (SPeech HEader REsources), konuşma araştırmaları için özellikle DARPA tarafından finanse edilen projeler kapsamında Ulusal Standartlar ve Teknoloji Enstitüsü tarafından oluşturulmuş özel bir ses dosyası formatıdır. Format, ham ses örneklerini örnekleme hızı, kanal sayısı, kodlama türü, konuşmacı demografisi ve transkripsiyon açıklamaları gibi üst verileri kodlayan yapılandırılmış ASCII başlıkla sarar — bu özellik konuşma veri derlemleri dağıtımı için idealdir. NIST dosyaları genellikle telefon kalitesinde örnekleme hızlarında (8 kHz veya 16 kHz) sıkıştırılmamış PCM veya mü-law ses depolar, ancak kapsayıcı çeşitli kodlamaları barındıracak kadar esnektir. Önemli bir avantajı, araştırmacıların ayrıntılı veri derlemi üst verilerini doğrudan dosyaya gömmesine olanak tanıyan zengin, kendi kendini tanımlayan başlıktır ve ek dosyalara gerek kalmaz. SPHERE ayrıca TIMIT, Switchboard ve Fisher veri derlemi gibi büyük konuşma veritabanları için fiili standart haline gelmiştir ve akademik ile devlet laboratuvarlarında geniş tanınırlık sağlar. Açık spesifikasyon ve komut satırı araçlarının (sphere, h_strip, w_decode) erişilebilirliği, bu dosyaların konuşma işleme hatlarında programatik olarak dönüştürülmesini, incelenmesini ve işlenmesini kolaylaştırır.
İlk yayın: 1990
HTK, Cambridge Üniversitesi Mühendislik Bölümü'nde konuşma tanıma araştırmaları için geliştirilen bir yazılım paketi olan Hidden Markov Model Toolkit'ın yerel dalga formu kapsayıcısıdır. 1993'te i̇lk dağıtılan HTK, dünya genelinde hesaplamalı dilbilim laboratuvarlarında hızla referans platform haline gelmiş ve dosya formatı da aynı yolu izlemiştir. Her dosya, çerçeve sayısını, 100 ns birimlerinde çerçeve süresini, çerçeve başına bayt sayısını ve veri türünü belirten bir tür kodu içeren 12 baytlık bir başlık ile öncelenmiş parametre vektörleri veya ham örnekler dizisi depolar — dalga formu PCM'den Mel-frekans kepstral katsayılarına ve filtre bankası enerjilerine kadar seçenekler mevcuttur. Bu çok yönlülük, tek bir kapsayıcının hem kaynak sesi hem de çıkarılan özellikleri ayrıştırıcı değiştirmeden taşımasını sağlar. Kasıtlı olarak minimalist başlık, hizalama dolgusu veya isteğe bağlı yığınlardan kaçınarak formatı C, Python veya MATLAB'da birkaç satır i̇kili G/Ç ile okumayı kolaylaştırır. HTK'nın kalıcı önemini destekleyen üç avantaj: HTK eğitim ve tanıma hattıyla sıkı entegrasyon, ayrıştırıcı belirsizliğini ortadan kaldıran deterministik bayt düzeni ve akademik veri derlemlerinde yaygın benimseme.
İlk yayın: 1993

Sık Sorulan Sorular

NIST neden HTK formatına dönüştürülür?

NIST SPHERE ve HTK her ikisi de konuşma araştırmasına hizmet eder ancak araç ekosistemleri farklıdır. HTK formatı, HTK konuşma araç kitiyle entegre çalışır.

HTK dosyalarını hangi programlarla açabilirim?

HTK konuşma tanıma araç kiti, SoX veya araştırma düzeyinde konuşma analiz araçlarıyla HTK dosyalarını açabilirsiniz.

Bu dönüştürme için özel yazılım gerekli mi?

Hiç gerekmez. Dönüştürme tamamen çevrimiçi gerçekleşir — tarayıcınızı açın, NIST dosyasını yükleyin ve HTK sonucunu indirin.

NIST - HTK dönüştürme ne kadar sürer?

Dönüştürme hızlıdır — standart uzunluktaki NIST kayıtları genellikle birkaç saniye içinde tamamlanır. Daha büyük dosyalar biraz daha fazla süre alabilir.

NIST - HTK dönüştürme hangi platformlarda çalışır?

Tüm platformlarda çalışır. Herhangi bir masaüstü veya mobil cihazda Chrome, Firefox, Safari ya da Edge tarayıcısını açmanız yeterlidir.

Dönüştürmeden önce ses ayarlarını değiştirebilir miyim?

Evet. NIST - HTK dönüştürme işlemini başlatmadan önce örnekleme hızı, bit derinliği ve kanal sayısını yapılandırabilirsiniz.