ตัวแปลง HTK เป็น VOC

แปลงเสียงวิจัย HTK เป็นรูปแบบ VOC ออนไลน์

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง

การตั้งค่า

ตัวแปลงสัญญาณเพื่อเข้ารหัสแทร็กเสียงตัวแปลงสัญญาณ "โดยไม่มีการเข้ารหัสใหม่" จะคัดลอกสตรีมเสียงจากไฟล์ขาเข้าไปยังขาออกโดยไม่ต้องเข้ารหัสซ้ำหากเป็นไปได้
กำหนดจำนวนช่องสัญญาณเสียง การตั้งค่านี้มีประโยชน์มากที่สุดเมื่อทำการลด (ดาวน์มิกซ์) ช่องสัญญาณ (เช่น จาก 5.1 เป็นสเตอริโอ)
กำหนดอัตราตัวอย่างของเสียง เพลงที่มีคลื่นความถี่เต็มที่ (20 Hz - 20 kHz) ต้องมีค่าไม่ต่ำกว่า 44.1 kHz เพื่อให้เกิดความโปร่งใส สามารถอ่านข้อมูลเพิ่มเติมได้ใน วิกิ

htk

HTK เป็นคอนเทนเนอร์รูปคลื่นดั้งเดิมของ Hidden Markov Model Toolkit ชุดซอฟต์แวร์ที่พัฒนาที่ภาควิชาวิศวกรรมของมหาวิทยาลัยเคมบริดจ์สำหรับการวิจัยด้านการรู้จำเสียงพูด เผยแพร่ครั้งแรกในปี 1993 HTK กลายเป็นแพลตฟอร์มอ้างอิงในห้องปฏิบัติการภาษาศาสตร์คอมพิวเตอร์ทั่วโลกอย่างรวดเร็ว และรูปแบบไฟล์ก็ได้รับความนิยมตามไปด้วย แต่ละไฟล์เก็บลำดับเวกเตอร์พารามิเตอร์หรือตัวอย่างดิบนำหน้าด้วยส่วนหัว 12 ไบต์ที่ระบุจำนวนเฟรม คาบเฟรมในหน่วย 100 ns จำนวนไบต์ต่อเฟรม และรหัสประเภทที่ระบุชนิดข้อมูล — ตัวเลือกมีตั้งแต่ waveform PCM ไปจนถึง Mel-frequency cepstral coefficients และพลังงาน filter-bank ความอเนกประสงค์นี้ช่วยให้คอนเทนเนอร์เดียวบรรจุทั้งเสียงต้นทางและคุณลักษณะที่สกัดออกมาโดยไม่ต้องเปลี่ยนตัวแยกวิเคราะห์ ส่วนหัวที่เรียบง่ายอย่างจงใจหลีกเลี่ยง alignment padding หรือ optional chunks ทำให้อ่านรูปแบบจาก C, Python หรือ MATLAB ได้ง่ายด้วยโค้ดไบนารี I/O เพียงไม่กี่บรรทัด ข้อดีสามประการที่สนับสนุนความเกี่ยวข้องอย่างต่อเนื่องของ HTK: การผสานรวมอย่างแน่นแฟ้นกับไปป์ไลน์ฝึกอบรมและรู้จำของ HTK เลย์เอาต์ไบต์ที่แน่นอนซึ่งขจัดความคลุมเครือของตัวแยกวิเคราะห์ และการนำไปใช้อย่างแพร่หลายในคอร์ปัสทางวิชาการ
อ่านเพิ่มเติม

voc

VOC (Creative Voice) เป็นคอนเทนเนอร์เสียงดิจิทัลที่พัฒนาโดย Creative Technology และเปิดตัวพร้อมกับการ์ด Sound Blaster ดั้งเดิมในปี 1989 ทำหน้าที่เป็นรูปแบบเสียงดั้งเดิมของตระกูล Sound Blaster ในยุค DOS เมื่อฮาร์ดแวร์ของ Creative ครองตลาดเสียง PC ไฟล์ VOC ใช้โครงสร้างแบบบล็อก — แต่ละไฟล์ประกอบด้วยบล็อกข้อมูลที่มีประเภทกำหนด สามารถบรรจุ PCM แบบ 8 บิตไม่มีเครื่องหมาย, Creative ADPCM 4 บิตและ 2.6 บิต, PCM แบบ 16 บิตมีเครื่องหมาย รวมถึงเสียงที่เข้ารหัส A-law และ mu-law โครงสร้างบล็อกนี้ยังรองรับช่วงเงียบ ลูปซ้ำ และจุดมาร์กเกอร์ ให้นักพัฒนาเกมควบคุมการเล่นเสียงได้อย่างละเอียด ข้อดีที่สำคัญคือการถอดรหัสในระดับฮาร์ดแวร์ — การ์ด Sound Blaster สามารถเล่นข้อมูล VOC โดยตรงผ่านการถ่ายโอน DMA ปลดปล่อย CPU สำหรับงานอื่นในยุคที่รอบการประมวลผลมีค่ามาก รูปแบบนี้ถูกใช้อย่างกว้างขวางในเกม DOS จาก id Software, Sierra และ LucasArts เมื่อ Windows และรูปแบบ WAV เริ่มแพร่หลาย VOC ก็ค่อยๆ หายไปจากกระแสหลัก แต่ยังคงมีความสำคัญสำหรับการอนุรักษ์เกมย้อนยุคและผู้ที่ทำงานกับคลังเสียง PC ย้อนยุค
อ่านเพิ่มเติม
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

วิจัยเสียงพูดเป็น VOC

แปลงไฟล์ HTK เป็น VOC — นำเสียงวิจัยเข้าสู่รูปแบบที่ใช้งานได้จริง

แปลงออนไลน์

การแปลง HTK เป็น VOC ทำงานบนเซิร์ฟเวอร์ทั้งหมด ไม่ต้องติดตั้งซอฟต์แวร์หรือประมวลผลในเครื่อง

คุณภาพสูง

VOC ให้คุณภาพเสียงที่ยอดเยี่ยมและขนาดไฟล์ที่มีประสิทธิภาพ — อัปเกรดที่ทันสมัยสำหรับไฟล์ HTK ของคุณ

วิธีแปลง HTK เป็น VOC

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ voc หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ voc ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

HTK เป็นคอนเทนเนอร์รูปคลื่นดั้งเดิมของ Hidden Markov Model Toolkit ชุดซอฟต์แวร์ที่พัฒนาที่ภาควิชาวิศวกรรมของมหาวิทยาลัยเคมบริดจ์สำหรับการวิจัยด้านการรู้จำเสียงพูด เผยแพร่ครั้งแรกในปี 1993 HTK กลายเป็นแพลตฟอร์มอ้างอิงในห้องปฏิบัติการภาษาศาสตร์คอมพิวเตอร์ทั่วโลกอย่างรวดเร็ว และรูปแบบไฟล์ก็ได้รับความนิยมตามไปด้วย แต่ละไฟล์เก็บลำดับเวกเตอร์พารามิเตอร์หรือตัวอย่างดิบนำหน้าด้วยส่วนหัว 12 ไบต์ที่ระบุจำนวนเฟรม คาบเฟรมในหน่วย 100 ns จำนวนไบต์ต่อเฟรม และรหัสประเภทที่ระบุชนิดข้อมูล — ตัวเลือกมีตั้งแต่ waveform PCM ไปจนถึง Mel-frequency cepstral coefficients และพลังงาน filter-bank ความอเนกประสงค์นี้ช่วยให้คอนเทนเนอร์เดียวบรรจุทั้งเสียงต้นทางและคุณลักษณะที่สกัดออกมาโดยไม่ต้องเปลี่ยนตัวแยกวิเคราะห์ ส่วนหัวที่เรียบง่ายอย่างจงใจหลีกเลี่ยง alignment padding หรือ optional chunks ทำให้อ่านรูปแบบจาก C, Python หรือ MATLAB ได้ง่ายด้วยโค้ดไบนารี I/O เพียงไม่กี่บรรทัด ข้อดีสามประการที่สนับสนุนความเกี่ยวข้องอย่างต่อเนื่องของ HTK: การผสานรวมอย่างแน่นแฟ้นกับไปป์ไลน์ฝึกอบรมและรู้จำของ HTK เลย์เอาต์ไบต์ที่แน่นอนซึ่งขจัดความคลุมเครือของตัวแยกวิเคราะห์ และการนำไปใช้อย่างแพร่หลายในคอร์ปัสทางวิชาการ
เผยแพร่ครั้งแรก: 1993
VOC (Creative Voice) เป็นคอนเทนเนอร์เสียงดิจิทัลที่พัฒนาโดย Creative Technology และเปิดตัวพร้อมกับการ์ด Sound Blaster ดั้งเดิมในปี 1989 ทำหน้าที่เป็นรูปแบบเสียงดั้งเดิมของตระกูล Sound Blaster ในยุค DOS เมื่อฮาร์ดแวร์ของ Creative ครองตลาดเสียง PC ไฟล์ VOC ใช้โครงสร้างแบบบล็อก — แต่ละไฟล์ประกอบด้วยบล็อกข้อมูลที่มีประเภทกำหนด สามารถบรรจุ PCM แบบ 8 บิตไม่มีเครื่องหมาย, Creative ADPCM 4 บิตและ 2.6 บิต, PCM แบบ 16 บิตมีเครื่องหมาย รวมถึงเสียงที่เข้ารหัส A-law และ mu-law โครงสร้างบล็อกนี้ยังรองรับช่วงเงียบ ลูปซ้ำ และจุดมาร์กเกอร์ ให้นักพัฒนาเกมควบคุมการเล่นเสียงได้อย่างละเอียด ข้อดีที่สำคัญคือการถอดรหัสในระดับฮาร์ดแวร์ — การ์ด Sound Blaster สามารถเล่นข้อมูล VOC โดยตรงผ่านการถ่ายโอน DMA ปลดปล่อย CPU สำหรับงานอื่นในยุคที่รอบการประมวลผลมีค่ามาก รูปแบบนี้ถูกใช้อย่างกว้างขวางในเกม DOS จาก id Software, Sierra และ LucasArts เมื่อ Windows และรูปแบบ WAV เริ่มแพร่หลาย VOC ก็ค่อยๆ หายไปจากกระแสหลัก แต่ยังคงมีความสำคัญสำหรับการอนุรักษ์เกมย้อนยุคและผู้ที่ทำงานกับคลังเสียง PC ย้อนยุค
ผู้พัฒนา: Creative Technology
เผยแพร่ครั้งแรก: 1989

คำถามที่พบบ่อย

ทำไมต้องแปลง HTK เป็น VOC?

HTK ถูกจำกัดอยู่ในเครื่องมือวิจัยเสียงพูด VOC ให้ความเข้ากันได้กับเครื่องเล่นสื่อและแอปพลิเคชันมาตรฐาน

แอปพลิเคชันอะไรเปิดไฟล์ VOC?

เครื่องมือเสียงหลายตัวรองรับ VOC ส่วนใหญ่ดาวน์โหลดได้ฟรีสำหรับระบบปฏิบัติการหลัก

คุณภาพเสียง VOC เป็นอย่างไร?

VOC ให้คุณภาพดีที่การตั้งค่ามาตรฐาน ความชัดเจนของเอาต์พุตขึ้นอยู่กับคุณภาพของไฟล์ HTK ต้นฉบับ

การแปลงเร็วแค่ไหน?

ทั้งสองรูปแบบมีขนาดไฟล์ที่จัดการได้ การแปลง HTK เป็น VOC เสร็จเกือบจะทันทีบนโครงสร้างพื้นฐานของเรา

ไฟล์ของฉันถูกเก็บเป็นส่วนตัวไหม?

ไฟล์ HTK ที่อัปโหลดจะถูกลบทันทีหลังแปลง ผลลัพธ์ VOC ถูกลบจากเซิร์ฟเวอร์อัตโนมัติภายใน 24 ชั่วโมง

ใช้งานบนมือถือได้ไหม?

ได้ ตัวแปลงทำงานในเบราว์เซอร์ใดก็ได้ — สมาร์ทโฟน แท็บเล็ต และเดสก์ท็อปทั้งหมดใช้ได้สำหรับการแปลง HTK เป็น VOC