HCOM - HTK Dönüştürücü

HCOM sesini HTK konuşma işleme için yeniden kodlayın

Dosyaları buraya bırakın. 1 GB maksimum dosya boyutu veya Kaydol
için
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Konuşma Araştırmasına Hazır

HCOM sesini HTK ekosistemine taşıyın — Hidden Markov Model Toolkit ve konuşma analizi iş hatları ile kullanım için dönüştürün.

Toolkit Kurulumu Gerekmez

HTK araç setini kurmadan HCOM'u HTK formatına dönüştürün. Yükleyin, dönüştürün ve indirin.

Veri Gizliliği

HCOM yüklemeleri dönüştürme sonrasında silinir. HTK çıktı dosyaları 24 saat içinde sunucularımızdan kaldırılır.

HCOM'i HTK'ye dönüştürme yöntemi

1

Dosyaları bilgisayar, Google Drive, Dropbox, URL'den veya sayfa üzerinden sürükleyerek seçin.

2

htk ya da sonuç olarak ihtiyacınız olan diğer formatlardan birini seçin (200'den fazla format desteklenir)

3

Haydi dosyayı dönüştürün ve htk dosyanızı hemen sonra indirebilirsiniz

Formatlar hakkında

HCOM, depolama alanının değerli ve modemlerin yavaş olduğu dönemde dijitalleştirilmiş sesi disketlerde ve BBS'lerde dağıtım için küçültmek amacıyla tasarlanmış, erken Macintosh döneminden bir Huffman kodlu ses formatıdır. Kodlayıcı, 8 bit işaretsiz PCM girişi alır, örnek delta değerlerinin frekans tablosu hesaplar ve yaygın deltaları kısa bit dizileriyle değiştiren optimal bir Huffman ağacı oluşturur. Konuşma kayıtlarında 2:1 veya daha i̇yi sıkıştırma oranları tipikti — 3,5 inçlik bir disketin yalnızca 800 KB taşıdığı zamanlarda anlamlı bir tasarruf. Dosyalar Macintosh kaynak çatalları olarak dağıtılır ve 1980'lerin sonlarında Mac yazılım alışverişini tanımlayan SoundApp ve BinHex ekosistemi aracılığıyla oynatılırdı. Format, orijinal Macintosh ses donanımının çıkış kapasitelerini karşılayan 22,255 kHz'e kadar örnekleme hızlarını destekliyordu. SoX gibi araçlar HCOM kod çözme desteğini sürdürerek arşivlenmiş kayıtların onlarca yıl sonra bile erişilebilir kalmasını sağlar. HCOM, koruma çalışmaları için üç pratik avantaj sunar: orijinal örnekleri tam olarak geri kazanan kayıpsız sıkıştırma, bağımsız kod çözme için her dosyaya gömülü Huffman tablosu ve binlerce eski Mac ses arşivindeki tarihsel yaygınlık.
Geliştirici: Apple Computer
İlk yayın: 1985
HTK, Cambridge Üniversitesi Mühendislik Bölümü'nde konuşma tanıma araştırmaları için geliştirilen bir yazılım paketi olan Hidden Markov Model Toolkit'ın yerel dalga formu kapsayıcısıdır. 1993'te i̇lk dağıtılan HTK, dünya genelinde hesaplamalı dilbilim laboratuvarlarında hızla referans platform haline gelmiş ve dosya formatı da aynı yolu izlemiştir. Her dosya, çerçeve sayısını, 100 ns birimlerinde çerçeve süresini, çerçeve başına bayt sayısını ve veri türünü belirten bir tür kodu içeren 12 baytlık bir başlık ile öncelenmiş parametre vektörleri veya ham örnekler dizisi depolar — dalga formu PCM'den Mel-frekans kepstral katsayılarına ve filtre bankası enerjilerine kadar seçenekler mevcuttur. Bu çok yönlülük, tek bir kapsayıcının hem kaynak sesi hem de çıkarılan özellikleri ayrıştırıcı değiştirmeden taşımasını sağlar. Kasıtlı olarak minimalist başlık, hizalama dolgusu veya isteğe bağlı yığınlardan kaçınarak formatı C, Python veya MATLAB'da birkaç satır i̇kili G/Ç ile okumayı kolaylaştırır. HTK'nın kalıcı önemini destekleyen üç avantaj: HTK eğitim ve tanıma hattıyla sıkı entegrasyon, ayrıştırıcı belirsizliğini ortadan kaldıran deterministik bayt düzeni ve akademik veri derlemlerinde yaygın benimseme.
İlk yayın: 1993

Sık Sorulan Sorular

HTK nedir?

HTK, Hidden Markov Model Toolkit için ses formatıdır — konuşma tanıma ve sinyal işleme araştırmaları için akademik bir çerçeve.

HCOM neden HTK'ya dönüştürülür?

HTK araç setini kullanan konuşma araştırma projeleri için. HCOM konuşma kayıtlarını HTK formatına dönüştürmek doğrudan analiz sağlar.

HTK ne için kullanılır?

HTK, akademik konuşma tanıma araştırmalarında standart bir araçtır. Fonem analizi, konuşma sentezi ve model eğitimi için ses işler.

HTK formatı karmaşık mı?

Hayır. HTK, doğrudan 16-bit PCM ses kullanır. Format basittir ancak HTK araştırma araç setine özgüdür.

HTK'yı akademi dışında kullanabilir miyim?

HTK öncelikle akademik bir araçtır. Formatın kendisi basit PCM dir, bu yüzden ses genel kullanım için diğer formatlara dönüştürülebilir.