ตัวแปลง HCOM เป็น HTK

เข้ารหัสเสียง HCOM สำหรับการประมวลผลเสียงพูด HTK

เลือกไฟล์ต่างๆ

วางไฟล์ต่างๆ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ

ไปยัง

พร้อมสำหรับวิจัยเสียงพูด

นำเสียง HCOM เข้าสู่ระบบนิเวศ HTK — แปลงเพื่อใช้กับ Hidden Markov Model Toolkit และไปป์ไลน์วิเคราะห์เสียงพูด

ไม่ต้องติดตั้ง Toolkit

แปลง HCOM เป็นฟอร์แมต HTK โดยไม่ต้องติดตั้ง HTK toolkit เพียงอัปโหลด แปลง แล้วดาวน์โหลด

ความเป็นส่วนตัวของข้อมูล

ไฟล์ HCOM ที่อัปโหลดจะถูกลบหลังแปลง ไฟล์ HTK จะถูกลบภายใน 24 ชั่วโมง

วิธีแปลง HCOM เป็น HTK

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

เลือกรูปแบบไฟล์ htk หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ htk ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

HCOM เป็นรูปแบบเสียงที่เข้ารหัสด้วย Huffman จากยุคแรกของ Macintosh ออกแบบมาเพื่อลดขนาดเสียงดิจิทัลสำหรับการแจกจ่ายบนฟล็อปปี้ดิสก์และระบบกระดานข่าวเมื่อพื้นที่จัดเก็บมีค่าและโมเด็มยังช้า ตัวเข้ารหัสรับอินพุต unsigned 8-bit PCM คำนวณตารางความถี่ของค่า sample-delta และสร้าง Huffman tree ที่เหมาะสมที่สุดซึ่งแทนที่ delta ที่พบบ่อยด้วยลำดับบิตสั้น อัตราส่วนการบีบอัด 2:1 หรือดีกว่าเป็นเรื่องปกติสำหรับการบันทึกเสียงพูด ซึ่งเป็นการประหยัดที่มีความหมายเมื่อฟล็อปปี้ 3.5 นิ้วจุเพียง 800 KB ไฟล์ถูกแจกจ่ายเป็น Macintosh resource forks และเล่นผ่านยูทิลิตี้อย่าง SoundApp และระบบนิเวศ BinHex ที่กำหนดการแลกเปลี่ยนซอฟต์แวร์ Mac ในช่วงปลายทศวรรษ 1980 รูปแบบรองรับอัตราสุ่มตัวอย่างสูงสุด 22.255 kHz ตรงกับความสามารถเอาต์พุตของฮาร์ดแวร์เสียง Macintosh ดั้งเดิม เครื่องมืออย่าง SoX ยังคงรองรับการถอดรหัส HCOM ทำให้การบันทึกที่เก็บไว้ยังเข้าถึงได้หลายทศวรรษต่อมา HCOM มีข้อดีสามประการในงานอนุรักษ์: การบีบอัดแบบไม่สูญเสียข้อมูลที่กู้คืนตัวอย่างดั้งเดิมได้อย่างแม่นยำ Huffman table ที่ฝังอยู่ในแต่ละไฟล์เพื่อการถอดรหัสโดยไม่ต้องพึ่งไฟล์ภายนอก และความแพร่หลายทางประวัติศาสตร์ในคลังเสียง Mac รุ่นเก่าหลายพันรายการ

ผู้พัฒนา: Apple Computer

เผยแพร่ครั้งแรก: 1985

HTK เป็นคอนเทนเนอร์รูปคลื่นดั้งเดิมของ Hidden Markov Model Toolkit ชุดซอฟต์แวร์ที่พัฒนาที่ภาควิชาวิศวกรรมของมหาวิทยาลัยเคมบริดจ์สำหรับการวิจัยด้านการรู้จำเสียงพูด เผยแพร่ครั้งแรกในปี 1993 HTK กลายเป็นแพลตฟอร์มอ้างอิงในห้องปฏิบัติการภาษาศาสตร์คอมพิวเตอร์ทั่วโลกอย่างรวดเร็ว และรูปแบบไฟล์ก็ได้รับความนิยมตามไปด้วย แต่ละไฟล์เก็บลำดับเวกเตอร์พารามิเตอร์หรือตัวอย่างดิบนำหน้าด้วยส่วนหัว 12 ไบต์ที่ระบุจำนวนเฟรม คาบเฟรมในหน่วย 100 ns จำนวนไบต์ต่อเฟรม และรหัสประเภทที่ระบุชนิดข้อมูล — ตัวเลือกมีตั้งแต่ waveform PCM ไปจนถึง Mel-frequency cepstral coefficients และพลังงาน filter-bank ความอเนกประสงค์นี้ช่วยให้คอนเทนเนอร์เดียวบรรจุทั้งเสียงต้นทางและคุณลักษณะที่สกัดออกมาโดยไม่ต้องเปลี่ยนตัวแยกวิเคราะห์ ส่วนหัวที่เรียบง่ายอย่างจงใจหลีกเลี่ยง alignment padding หรือ optional chunks ทำให้อ่านรูปแบบจาก C, Python หรือ MATLAB ได้ง่ายด้วยโค้ดไบนารี I/O เพียงไม่กี่บรรทัด ข้อดีสามประการที่สนับสนุนความเกี่ยวข้องอย่างต่อเนื่องของ HTK: การผสานรวมอย่างแน่นแฟ้นกับไปป์ไลน์ฝึกอบรมและรู้จำของ HTK เลย์เอาต์ไบต์ที่แน่นอนซึ่งขจัดความคลุมเครือของตัวแยกวิเคราะห์ และการนำไปใช้อย่างแพร่หลายในคอร์ปัสทางวิชาการ

ผู้พัฒนา: Cambridge University Engineering Department

เผยแพร่ครั้งแรก: 1993

คำถามที่พบบ่อย

HTK คืออะไร?

HTK เป็นฟอร์แมตเสียงสำหรับ Hidden Markov Model Toolkit — เฟรมเวิร์กวิชาการสำหรับการวิจัยการรู้จำเสียงพูดและประมวลผลสัญญาณ

ทำไมต้องแปลง HCOM เป็น HTK?

สำหรับโปรเจกต์วิจัยเสียงพูดที่ใช้ HTK toolkit การแปลงบันทึกเสียงพูด HCOM เป็นฟอร์แมต HTK ช่วยให้วิเคราะห์ได้โดยตรง

HTK ใช้ทำอะไร?

HTK เป็นเครื่องมือมาตรฐานในการวิจัยการรู้จำเสียงพูดเชิงวิชาการ ประมวลผลเสียงสำหรับการวิเคราะห์หน่วยเสียง การสังเคราะห์เสียงพูด และฝึกโมเดล

ฟอร์แมต HTK ซับซ้อนไหม?

ไม่ HTK ใช้เสียง PCM 16 บิตที่ตรงไปตรงมา ฟอร์แมตเรียบง่ายแต่เฉพาะสำหรับ HTK research toolkit

ใช้ HTK นอกวงวิชาการได้ไหม?

HTK เป็นเครื่องมือวิชาการเป็นหลัก ฟอร์แมตเป็น PCM อย่างง่าย จึงสามารถแปลงเสียงเป็นฟอร์แมตอื่นสำหรับใช้งานทั่วไป

การแปลงที่เกี่ยวข้อง

HCOM เป็น MP3

HCOM เป็น WAV

HCOM เป็น AAC

HCOM เป็น AC3

HCOM เป็น FLAC

HCOM เป็น OGG

HCOM เป็น AIFF

HCOM เป็น AMR

HCOM เป็น M4A

HCOM เป็น M4R

HCOM เป็น WMA

HCOM เป็น DTS

HCOM เป็น OPUS

HCOM เป็น SPX

HCOM เป็น CAF

HCOM เป็น W64

HCOM เป็น WV

HCOM เป็น VOC

HCOM เป็น TTA

HCOM เป็น RA

HCOM เป็น MP2

HCOM เป็น OGA

HCOM เป็น PVF

HCOM เป็น PRC

HCOM เป็น MAUD

HCOM เป็น 8SVX

HCOM เป็น AMB

HCOM เป็น AU

HCOM เป็น SND

HCOM เป็น SNDR

HCOM เป็น SNDT

HCOM เป็น AVR

HCOM เป็น CDDA

HCOM เป็น CVS

HCOM เป็น CVSD

HCOM เป็น CVU

HCOM เป็น DVMS

HCOM เป็น VMS

HCOM เป็น FAP

HCOM เป็น PAF

HCOM เป็น FSSD

HCOM เป็น SOU

HCOM เป็น GSRT

HCOM เป็น GSM

HCOM เป็น HTK

HCOM เป็น IMA

HCOM เป็น IRCAM

HCOM เป็น SLN

HCOM เป็น SPH

HCOM เป็น NIST

HCOM เป็น SMP

HCOM เป็น TXW

HCOM เป็น VOX

HCOM เป็น WVE

HCOM เป็น SD2

ตัวแปลงเฉพาะ

MP3 เป็น HTK

WAV เป็น HTK

MP4 เป็น HTK

FLAC เป็น HTK

M4A เป็น HTK

OGG เป็น HTK

MPG เป็น HTK

ASF เป็น HTK

AAC เป็น HTK

3G2 เป็น HTK

3GP เป็น HTK

AAF เป็น HTK

AV1 เป็น HTK

AVCHD เป็น HTK

AVI เป็น HTK

CAVS เป็น HTK

DIVX เป็น HTK

DV เป็น HTK

F4V เป็น HTK

FLV เป็น HTK

HEVC เป็น HTK

M2TS เป็น HTK

M2V เป็น HTK

M4V เป็น HTK

MJPEG เป็น HTK

MKV เป็น HTK

MOD เป็น HTK

MOV เป็น HTK

MPEG เป็น HTK

MPEG-2 เป็น HTK