ตัวแปลง SOU เป็น HTK

เปลี่ยนเสียง SOU เป็นรูปแบบ HTK ได้ในเบราว์เซอร์

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

เปลี่ยนรูปแบบ

SOU เป็นรูปแบบเก่าที่มีการรองรับน้อย การแปลงเป็น HTK นำเสียงเข้าสู่รูปแบบที่ HTK toolkit และเครื่องมืออื่นรู้จัก

เครื่องมือบนเว็บ

ทุกอย่างเกิดขึ้นในเบราว์เซอร์ — ไม่มีปลั๊กอิน ไม่ต้องดาวน์โหลด ไม่ต้องติดตั้ง เปิดหน้าเว็บแล้วแปลง SOU เป็น HTK

ประมวลผลระยะไกล

การแปลงทำงานบนเซิร์ฟเวอร์ ไม่ใช่อุปกรณ์ของคุณ — ไฟล์ SOU ขนาดใหญ่ก็แปลงเป็น HTK ได้โดยไม่ทำเครื่องช้า

วิธีแปลง SOU เป็น HTK

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ htk หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ htk ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

SOU เป็นการกำหนดรูปแบบเสียงดิบที่ทำหน้าที่เป็นนามแฝงสำหรับข้อมูล PCM แบบ 8 บิตไม่มีเครื่องหมาย (u8) ในเฟรมเวิร์กประมวลผลเสียง SoX ไฟล์ที่มีนามสกุล .sou ประกอบด้วยตัวอย่างเสียงดิบที่ไม่บีบอัดแบบไม่มีส่วนหัว จัดเก็บเป็นจำนวนเต็ม 8 บิตไม่มีเครื่องหมาย — แต่ละไบต์แทนค่าแอมพลิจูดเดียวตั้งแต่ 0 ถึง 255 โดย 128 เป็นจุดกลางที่เงียบ เนื่องจากไม่มีส่วนหัว พารามิเตอร์การเล่นเช่นอัตราสุ่มตัวอย่างและจำนวนช่องสัญญาณต้องระบุจากภายนอก ค่าเริ่มต้นโดยทั่วไปคือโมโนที่ 8000 Hz แม้ว่าข้อมูลจะแทนอัตราใดก็ได้ที่ฮาร์ดแวร์บันทึกรองรับ การเข้ารหัส u8 ที่ SOU เป็นนามแฝงเป็นหนึ่งในการแสดงเสียงดิจิทัลที่เรียบง่ายที่สุด มีมาก่อนคอนเทนเนอร์เสียงแบบมีโครงสร้างเช่น WAV และ AIFF PCM แบบดิบไม่มีเครื่องหมายถูกผลิตทั่วไปโดยการ์ดเสียงและดิจิไทเซอร์ยุคแรกในช่วงปลายทศวรรษ 1980 และต้นทศวรรษ 1990 เมื่อข้อจำกัดด้านพื้นที่จัดเก็บและพลังการประมวลผลทำให้รูปแบบที่ไม่มีส่วนหัวเป็นตัวเลือกที่เหมาะสม ข้อดีคือความเรียบง่ายอย่างสุดขั้ว — ไฟล์ SOU สามารถอ่านได้โดยโปรแกรมใดก็ได้ที่ทำ I/O ไฟล์พื้นฐาน โดยไม่ต้องแยกวิเคราะห์โครงสร้างคอนเทนเนอร์หรือถอดรหัสเมทาดาทา การแปลงเป็นคอนเทนเนอร์สมัยใหม่ใดๆ ก็ไม่สูญเสียคุณภาพและรวดเร็ว เนื่องจากสามารถห่อหุ้มตัวอย่าง PCM ดิบในส่วนหัว WAV หรือ AIFF ได้โดยไม่ต้องแปลงรหัสใดๆ
ผู้พัฒนา: SoX Contributors
เผยแพร่ครั้งแรก: 1991
HTK เป็นคอนเทนเนอร์รูปคลื่นดั้งเดิมของ Hidden Markov Model Toolkit ชุดซอฟต์แวร์ที่พัฒนาที่ภาควิชาวิศวกรรมของมหาวิทยาลัยเคมบริดจ์สำหรับการวิจัยด้านการรู้จำเสียงพูด เผยแพร่ครั้งแรกในปี 1993 HTK กลายเป็นแพลตฟอร์มอ้างอิงในห้องปฏิบัติการภาษาศาสตร์คอมพิวเตอร์ทั่วโลกอย่างรวดเร็ว และรูปแบบไฟล์ก็ได้รับความนิยมตามไปด้วย แต่ละไฟล์เก็บลำดับเวกเตอร์พารามิเตอร์หรือตัวอย่างดิบนำหน้าด้วยส่วนหัว 12 ไบต์ที่ระบุจำนวนเฟรม คาบเฟรมในหน่วย 100 ns จำนวนไบต์ต่อเฟรม และรหัสประเภทที่ระบุชนิดข้อมูล — ตัวเลือกมีตั้งแต่ waveform PCM ไปจนถึง Mel-frequency cepstral coefficients และพลังงาน filter-bank ความอเนกประสงค์นี้ช่วยให้คอนเทนเนอร์เดียวบรรจุทั้งเสียงต้นทางและคุณลักษณะที่สกัดออกมาโดยไม่ต้องเปลี่ยนตัวแยกวิเคราะห์ ส่วนหัวที่เรียบง่ายอย่างจงใจหลีกเลี่ยง alignment padding หรือ optional chunks ทำให้อ่านรูปแบบจาก C, Python หรือ MATLAB ได้ง่ายด้วยโค้ดไบนารี I/O เพียงไม่กี่บรรทัด ข้อดีสามประการที่สนับสนุนความเกี่ยวข้องอย่างต่อเนื่องของ HTK: การผสานรวมอย่างแน่นแฟ้นกับไปป์ไลน์ฝึกอบรมและรู้จำของ HTK เลย์เอาต์ไบต์ที่แน่นอนซึ่งขจัดความคลุมเครือของตัวแยกวิเคราะห์ และการนำไปใช้อย่างแพร่หลายในคอร์ปัสทางวิชาการ
เผยแพร่ครั้งแรก: 1993

คำถามที่พบบ่อย

ทำไมต้องเปลี่ยนจาก SOU เป็น HTK?

SOU เป็นรูปแบบ PCM 8 บิตไม่มีเฮดเดอร์ที่ไม่เข้ากับเครื่องเล่นสมัยใหม่ การแปลงเป็น HTK ให้รูปแบบวิจัยการรู้จำเสียงพูด

ซอฟต์แวร์อะไรเปิดไฟล์ HTK ได้?

เปิด HTK ได้ด้วย HTK toolkit, SoX และเครื่องมือวิจัยการรู้จำเสียงพูด

การแปลง SOU เป็น HTK มีผลต่อคุณภาพไหม?

HTK รักษาข้อมูลเสียงอย่างซื่อสัตย์ เนื่องจาก SOU มีคุณภาพจำกัด เอาต์พุต HTK ตรงกับคุณภาพต้นฉบับ

การแปลง SOU เป็น HTK ใช้ได้ทุกแพลตฟอร์มไหม?

ใช้ได้ทุกแพลตฟอร์ม — เดสก์ท็อปหรือมือถือ เปิดเบราว์เซอร์ อัปโหลดไฟล์ SOU แล้วแปลงเป็น HTK

เสียง SOU ของฉันถูกเก็บเป็นส่วนตัวระหว่างการแปลงไหม?

ไฟล์ SOU ที่อัปโหลดจะถูกลบทันทีหลังแปลง ผลลัพธ์ HTK จะถูกลบภายใน 24 ชั่วโมง

ต้องติดตั้งอะไรสำหรับ SOU เป็น HTK ไหม?

ไม่ต้องติดตั้ง ตัวแปลงทำงานในเว็บเบราว์เซอร์ทั้งหมด — แค่อัปโหลด แปลง แล้วดาวน์โหลด