ตัวแปลง CVSD เป็น HTK

แปลงเสียง CVSD เป็น HTK สำหรับวิจัยเสียงพูด

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

วิจัยเสียงพูด

แปลง CVSD เป็น HTK — ฟอร์แมตสำหรับ Hidden Markov Model Toolkit และไปป์ไลน์วิเคราะห์เสียงพูด

ไม่ต้องติดตั้ง Toolkit

แปลงออนไลน์โดยไม่ต้องติดตั้ง HTK toolkit

ไฟล์ปลอดภัย

ไฟล์ CVSD จะถูกลบหลังแปลง HTK จะถูกลบภายใน 24 ชั่วโมง

วิธีแปลง CVSD เป็น HTK

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ htk หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ htk ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

CVSD (Continuously Variable Slope Delta modulation) เป็นวิธีแปลงเสียงพูดเป็นดิจิทัลที่ได้รับมาตรฐานสำหรับการใช้งานทางทหารและโทรศัพท์โดย NATO และ CCITT ในช่วงทศวรรษ 1970 เข้ารหัสผลต่างระหว่างตัวอย่างที่ต่อเนื่องกันเป็นบิตเดียว — 1 ถ้าตัวอย่างปัจจุบันเกินค่าทำนาย 0 ในกรณีอื่น — ขณะที่ตัวกรอง syllabic companding ปรับขนาดสเต็ปโดยติดตามชุดบิตที่เหมือนกัน ทำงานที่ 16 ถึง 64 kbps CVSD สร้างสมดุลระหว่างความชัดเจนของเสียงพูดกับแบนด์วิดท์ ทำให้เป็นการเข้ารหัสที่เลือกใช้สำหรับลิงก์ทางทหารที่ปลอดภัยและระบบวิทยุยุทธวิธี บิตสตรีมสามารถถอดรหัสด้วยฮาร์ดแวร์ที่ตรงไปตรงมา ซึ่งเดิมทีสร้างในวงจรรวมเฉพาะ ข้อดีคือความเรียบง่ายในการนำไปใช้ — ตัวเข้ารหัสและถอดรหัสต้องการทรัพยากรน้อยที่สุด ทำให้ประมวลผลแบบเรียลไทม์บนฮาร์ดแวร์แบบฝังตัวที่ใช้พลังงานต่ำ ความทนทานภายใต้สภาวะที่มีสัญญาณรบกวนเป็นอีกจุดแข็ง เนื่องจากข้อผิดพลาดบิตเดียวส่งผลกระทบเฉพาะตัวอย่างในพื้นที่แทนที่จะทำลายเฟรมทั้งหมด SoX ให้การรองรับการเข้ารหัสและถอดรหัสด้วยซอฟต์แวร์ ทำให้ระบบสมัยใหม่สามารถทำงานกับการบันทึก CVSD เก่าจากคลังทหารและโครงสร้างพื้นฐานโทรคมนาคมรุ่นเก่า
ผู้พัฒนา: CCITT / NATO
เผยแพร่ครั้งแรก: 1970
HTK เป็นคอนเทนเนอร์รูปคลื่นดั้งเดิมของ Hidden Markov Model Toolkit ชุดซอฟต์แวร์ที่พัฒนาที่ภาควิชาวิศวกรรมของมหาวิทยาลัยเคมบริดจ์สำหรับการวิจัยด้านการรู้จำเสียงพูด เผยแพร่ครั้งแรกในปี 1993 HTK กลายเป็นแพลตฟอร์มอ้างอิงในห้องปฏิบัติการภาษาศาสตร์คอมพิวเตอร์ทั่วโลกอย่างรวดเร็ว และรูปแบบไฟล์ก็ได้รับความนิยมตามไปด้วย แต่ละไฟล์เก็บลำดับเวกเตอร์พารามิเตอร์หรือตัวอย่างดิบนำหน้าด้วยส่วนหัว 12 ไบต์ที่ระบุจำนวนเฟรม คาบเฟรมในหน่วย 100 ns จำนวนไบต์ต่อเฟรม และรหัสประเภทที่ระบุชนิดข้อมูล — ตัวเลือกมีตั้งแต่ waveform PCM ไปจนถึง Mel-frequency cepstral coefficients และพลังงาน filter-bank ความอเนกประสงค์นี้ช่วยให้คอนเทนเนอร์เดียวบรรจุทั้งเสียงต้นทางและคุณลักษณะที่สกัดออกมาโดยไม่ต้องเปลี่ยนตัวแยกวิเคราะห์ ส่วนหัวที่เรียบง่ายอย่างจงใจหลีกเลี่ยง alignment padding หรือ optional chunks ทำให้อ่านรูปแบบจาก C, Python หรือ MATLAB ได้ง่ายด้วยโค้ดไบนารี I/O เพียงไม่กี่บรรทัด ข้อดีสามประการที่สนับสนุนความเกี่ยวข้องอย่างต่อเนื่องของ HTK: การผสานรวมอย่างแน่นแฟ้นกับไปป์ไลน์ฝึกอบรมและรู้จำของ HTK เลย์เอาต์ไบต์ที่แน่นอนซึ่งขจัดความคลุมเครือของตัวแยกวิเคราะห์ และการนำไปใช้อย่างแพร่หลายในคอร์ปัสทางวิชาการ
เผยแพร่ครั้งแรก: 1993

คำถามที่พบบ่อย

ข้อดีของการแปลง CVSD เป็น HTK?

CVSD เป็นฟอร์แมตเก่า HTK ให้ฟอร์แมตสำหรับเฟรมเวิร์กวิจัยรู้จำเสียงพูด

อะไรเปิดไฟล์ HTK?

HTK toolkit, Kaldi และเครื่องมือวิจัยเสียงพูดรองรับ HTK

มีผลต่อคุณภาพหรือไม่?

เนื่องจาก CVSD มีคุณภาพจำกัด เอาต์พุต HTK ตรงกับต้นฉบับ

ใช้ได้บนมือถือไหม?

ได้ ตัวแปลงทำงานในเบราว์เซอร์บนทุกอุปกรณ์

เสียงปลอดภัยไหม?

ไฟล์ CVSD จะถูกลบหลังแปลง HTK จะถูกลบภายใน 24 ชั่วโมง

ต้องสมัครไหม?

ไม่ต้อง เพียงอัปโหลด แปลง แล้วดาวน์โหลด