TAK'tan NIST'e Dönüştürücü

TAK sesini NIST Sphere formatına çevrimiçi kodlayın

Dosyaları buraya bırakın. 1 GB maksimum dosya boyutu veya Kaydol
için
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Konuşma Değerlendirmesi

NIST formatı konuşma tanıma kıyaslamaları için standarttır — yüksek kaliteli değerlendirme verisi için kayıpsız TAK kaynağından dönüştürün.

Temiz Kaynak

Kayıpsız TAK, konuşma kayıtlarınızın önceki kodlamadan kaynaklanan sıkıştırma artefaktları olmadan NIST formatına girmesini sağlar.

Çevrimiçi İşleme

NIST araç seti kurulumu gerektirmez — sunucularımız TAK dosyasını tarayıcınız üzerinden NIST formatına kodlar.

TAK'i NIST'ye dönüştürme yöntemi

1

Dosyaları bilgisayar, Google Drive, Dropbox, URL'den veya sayfa üzerinden sürükleyerek seçin.

2

nist ya da sonuç olarak ihtiyacınız olan diğer formatlardan birini seçin (200'den fazla format desteklenir)

3

Haydi dosyayı dönüştürün ve nist dosyanızı hemen sonra indirebilirsiniz

Formatlar hakkında

TAK (Tom's lossless Audio Kompressor), Alman geliştirici Thomas Becker tarafından oluşturulan yüksek performanslı kayıpsız ses kodekidir ve i̇lk genel sürümü 2007'de yayınlanmıştır. Başlangıçta YALAC olarak adlandırılan proje, lansmandan önce yeniden adlandırılmış ve belirgin biçimde daha hızlı kod çözme sunarken FLAC'a rakip veya onu aşan sıkıştırma oranları sağlamasıyla hızla tanınırlık kazanmıştır. TAK, CD kalitesinden yüksek çözünürlüklü stüdyo masterlerine kadar her şeyi kapsayan 24 bit derinliğe ve 192 kHz örnekleme hızına kadar PCM sesi destekler. En güçlü satış noktalarından biri kodlama hızıdır: maksimum sıkıştırmada bile TAK, rakip kayıpsız kodeklerin çoğunun varsayılan ayarlarından daha hızlı kodlar. Kod çözücü de aynı şekilde verimlidir ve mütevazı donanımlarda gerçek zamanlı oynatmayı sorunsuz kılar. CRC-32 sağlama toplamlarıyla hata algılama, arşivleme amaçları için bit düzeyinde mükemmel bütünlüğü sağlar. TAK ayrıca çok parçalı albümleri düzenlemek için gömülü cue sheet'leri ve APEv2 etiketlerini destekler. Başlıca ödünleşim, TAK'ın kapalı kaynak ve yalnızca Windows platformuyla sınırlı kalması olup çapraz platform benimsemesini kısıtlar. Windows sistemlerinde sıkıştırma verimliliği ve hıza öncelik veren kullanıcılar için TAK, mevcut en i̇yi kayıpsız seçenekler arasında yer alır.
Geliştirici: Thomas Becker
İlk yayın: 2007
NIST SPHERE (SPeech HEader REsources), konuşma araştırmaları için özellikle DARPA tarafından finanse edilen projeler kapsamında Ulusal Standartlar ve Teknoloji Enstitüsü tarafından oluşturulmuş özel bir ses dosyası formatıdır. Format, ham ses örneklerini örnekleme hızı, kanal sayısı, kodlama türü, konuşmacı demografisi ve transkripsiyon açıklamaları gibi üst verileri kodlayan yapılandırılmış ASCII başlıkla sarar — bu özellik konuşma veri derlemleri dağıtımı için idealdir. NIST dosyaları genellikle telefon kalitesinde örnekleme hızlarında (8 kHz veya 16 kHz) sıkıştırılmamış PCM veya mü-law ses depolar, ancak kapsayıcı çeşitli kodlamaları barındıracak kadar esnektir. Önemli bir avantajı, araştırmacıların ayrıntılı veri derlemi üst verilerini doğrudan dosyaya gömmesine olanak tanıyan zengin, kendi kendini tanımlayan başlıktır ve ek dosyalara gerek kalmaz. SPHERE ayrıca TIMIT, Switchboard ve Fisher veri derlemi gibi büyük konuşma veritabanları için fiili standart haline gelmiştir ve akademik ile devlet laboratuvarlarında geniş tanınırlık sağlar. Açık spesifikasyon ve komut satırı araçlarının (sphere, h_strip, w_decode) erişilebilirliği, bu dosyaların konuşma işleme hatlarında programatik olarak dönüştürülmesini, incelenmesini ve işlenmesini kolaylaştırır.
İlk yayın: 1990

Sık Sorulan Sorular

NIST formatı nedir?

NIST, Ulusal Standartlar ve Teknoloji Enstitüsü tarafından konuşma değerlendirme veri setleri için kullanılan ses formatı spesifikasyonudur.

TAK neden NIST'e dönüştürülür?

NIST, konuşma tanıma kıyaslamaları ve değerlendirme veri setleri için gereklidir. Kayıpsız TAK, bu çalışma için temiz kayıtlar sağlar.

NIST dosyalarını ne okur?

Kaldi, HTK, NIST araçları ve çeşitli konuşma tanıma çerçeveleri NIST formatındaki sesleri model eğitimi için işler.

NIST, SPH'den farklı mıdır?

Yakından ilişkilidirler — her ikisi de NIST Sphere başlık spesifikasyonunu kullanır. Bazı araçlar bunları birbirinin yerine kullanır.

Dönüştürme gizli midir?

TAK yüklemeleri işlemden hemen sonra silinir. NIST çıktıları 24 saat içinde sunuculardan kaldırılır.