ตัวแปลง CVS เป็น HTK

แปลงเสียง CVS เป็น HTK ได้อย่างง่ายดายผ่านออนไลน์

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

ไม่ใช้ทรัพยากรเครื่อง

การแปลงทำงานบนเซิร์ฟเวอร์ของเรา ไม่ใช่อุปกรณ์ของคุณ — ดังนั้นแม้ไฟล์เสียง CVS ขนาดใหญ่ก็แปลงเป็น HTK ได้โดยไม่ทำให้เครื่องช้าลง

แปลงเป็นชุด

อัปโหลดไฟล์เสียง CVS หลายไฟล์พร้อมกันและแปลงเป็น HTK ทั้งหมดพร้อมกัน — ไม่ต้องทำซ้ำทีละไฟล์

รูปแบบทันสมัย

CVS เป็นรูปแบบเก่าที่แทบไม่มีการรองรับ การแปลงเป็น HTK นำเสียงของคุณเข้าสู่รูปแบบที่ HTK toolkit และเครื่องมืออื่นๆ รู้จัก

วิธีแปลง CVS เป็น HTK

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ htk หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ htk ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

CVS เป็นการเข้ารหัสเสียงสำหรับโทรศัพท์ที่ใช้ Continuously Variable Slope Delta modulation แสดงเสียงพูดผ่านรูปแบบ delta 1 บิตที่ขนาดสเต็ปปรับตามแอมพลิจูดของสัญญาณเข้า พัฒนาภายใต้มาตรฐาน CCITT (ปัจจุบัน ITU-T) ในช่วงทศวรรษ 1970 CVS เข้ารหัสโดยเปรียบเทียบแต่ละตัวอย่างกับตัวอย่างก่อนหน้าและส่งออกบิตเดียว — ขึ้นหรือลง — โดยขนาดความชันปรับตามรูปแบบบิตล่าสุด ให้อัตราบิตที่ต่ำมาก โดยทั่วไป 16 kbps ที่อัตราสุ่มตัวอย่าง 8 kHz มีประสิทธิภาพสำหรับเสียงพูดแบนด์แคบบนช่องสัญญาณที่จำกัด ไฟล์ CVS เก็บข้อมูล delta แบบมีเครื่องหมายและมักประมวลผลด้วยเครื่องมืออย่าง SoX ข้อดีสำคัญคือความประหยัดแบนด์วิดท์: วิธีการ 1 บิตต่อตัวอย่างต้องการความจุในการส่งน้อยที่สุด จำเป็นสำหรับลิงก์วิทยุทางทหารและโครงสร้างพื้นฐานโทรศัพท์ดิจิทัลยุคแรก กลไกความชันแบบปรับตัวยังป้องกันความเพี้ยนจากการรับภาระเกินบนสัญญาณที่เปลี่ยนแปลงเร็ว ในขณะที่รักษาเสียงรบกวนแบบเม็ดให้อยู่ในระดับยอมรับได้ขณะช่วงเงียบ แม้ตัวแปลงสัญญาณแบนด์กว้างสมัยใหม่จะเข้ามาแทนที่ CVS แต่ยังคงมีความสำคัญทางประวัติศาสตร์และมีประโยชน์เฉพาะทางในอุปกรณ์โทรศัพท์และการสื่อสารแบบฝังตัวรุ่นเก่า
ผู้พัฒนา: CCITT / ITU-T
เผยแพร่ครั้งแรก: 1970
HTK เป็นคอนเทนเนอร์รูปคลื่นดั้งเดิมของ Hidden Markov Model Toolkit ชุดซอฟต์แวร์ที่พัฒนาที่ภาควิชาวิศวกรรมของมหาวิทยาลัยเคมบริดจ์สำหรับการวิจัยด้านการรู้จำเสียงพูด เผยแพร่ครั้งแรกในปี 1993 HTK กลายเป็นแพลตฟอร์มอ้างอิงในห้องปฏิบัติการภาษาศาสตร์คอมพิวเตอร์ทั่วโลกอย่างรวดเร็ว และรูปแบบไฟล์ก็ได้รับความนิยมตามไปด้วย แต่ละไฟล์เก็บลำดับเวกเตอร์พารามิเตอร์หรือตัวอย่างดิบนำหน้าด้วยส่วนหัว 12 ไบต์ที่ระบุจำนวนเฟรม คาบเฟรมในหน่วย 100 ns จำนวนไบต์ต่อเฟรม และรหัสประเภทที่ระบุชนิดข้อมูล — ตัวเลือกมีตั้งแต่ waveform PCM ไปจนถึง Mel-frequency cepstral coefficients และพลังงาน filter-bank ความอเนกประสงค์นี้ช่วยให้คอนเทนเนอร์เดียวบรรจุทั้งเสียงต้นทางและคุณลักษณะที่สกัดออกมาโดยไม่ต้องเปลี่ยนตัวแยกวิเคราะห์ ส่วนหัวที่เรียบง่ายอย่างจงใจหลีกเลี่ยง alignment padding หรือ optional chunks ทำให้อ่านรูปแบบจาก C, Python หรือ MATLAB ได้ง่ายด้วยโค้ดไบนารี I/O เพียงไม่กี่บรรทัด ข้อดีสามประการที่สนับสนุนความเกี่ยวข้องอย่างต่อเนื่องของ HTK: การผสานรวมอย่างแน่นแฟ้นกับไปป์ไลน์ฝึกอบรมและรู้จำของ HTK เลย์เอาต์ไบต์ที่แน่นอนซึ่งขจัดความคลุมเครือของตัวแยกวิเคราะห์ และการนำไปใช้อย่างแพร่หลายในคอร์ปัสทางวิชาการ
เผยแพร่ครั้งแรก: 1993

คำถามที่พบบ่อย

ทำไม HTK ถึงเป็นตัวเลือกที่ดีกว่า CVS?

CVS ไม่ได้รับการรองรับจากซอฟต์แวร์เสียงสมัยใหม่ การแปลงเป็น HTK ให้รูปแบบสำหรับงานวิจัยการรู้จำเสียงพูด

ใช้อะไรเปิดไฟล์ HTK ได้?

สามารถเปิด HTK ได้ด้วย HTK toolkit, SoX และเครื่องมือวิจัยการรู้จำเสียงพูด

การแปลง CVS เป็น HTK มีผลต่อคุณภาพไหม?

HTK รักษาข้อมูลเสียงอย่างซื่อสัตย์ เนื่องจาก CVS มีความเที่ยงตรงต่ำอยู่แล้ว เอาต์พุต HTK จะตรงกับคุณภาพต้นฉบับ

แปลงจากโทรศัพท์มือถือได้ไหม?

ได้ ตัวแปลงออนไลน์นี้ใช้งานได้ทุกแพลตฟอร์ม — ใช้ได้จากคอมพิวเตอร์ แท็บเล็ต หรือสมาร์ทโฟนที่มีเว็บเบราว์เซอร์

การแปลง CVS เป็น HTK มีข้อจำกัดไหม?

การแปลงมาตรฐานใช้งานได้โดยไม่มีข้อจำกัดสำหรับการใช้งานทั่วไป แผนพรีเมียมให้ความเร็วและความจุเพิ่มเติม

ต้องลงทะเบียนก่อนแปลงไหม?

ไม่ต้องสร้างบัญชีสำหรับการแปลงมาตรฐาน เพียงอัปโหลดไฟล์ CVS เลือก HTK แล้วดาวน์โหลดผลลัพธ์