ตัวแปลง AVR เป็น HTK

แปลง Audio Visual Research AVR เป็นรูปแบบวิจัย HTK

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

กู้คืนเสียงวิจัย

ดึงเสียงจากรูปแบบ AVR ดั้งเดิมและแปลงเป็น HTK — เข้าถึงการบันทึกวิจัย Atari ST ในรูปแบบที่รองรับ

ไม่ต้องใช้โปรแกรมจำลอง

แปลงไฟล์ AVR โดยไม่ต้องใช้โปรแกรมจำลอง Atari ST หรือคำสั่ง SoX กระบวนการทั้งหมดทำงานในเว็บเบราว์เซอร์

ประมวลผลอย่างปลอดภัย

ไฟล์ AVR ที่อัปโหลดจะถูกลบทันทีหลังแปลง ไฟล์เอาต์พุตจะถูกลบภายใน 24 ชั่วโมง

วิธีแปลง AVR เป็น HTK

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ htk หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ htk ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

AVR (Audio Visual Research) เป็นรูปแบบเสียงที่มีต้นกำเนิดบน Apple Macintosh ราวปี 1989 สร้างโดยบริษัท Audio Visual Research สำหรับเครื่องมือตัดต่อและสังเคราะห์เสียงของพวกเขา เก็บตัวอย่างเสียงดิบนำหน้าด้วยส่วนหัวขนาดคงที่ที่บรรจุอัตราสุ่มตัวอย่าง ความลึกบิต (8 หรือ 16 บิต) การกำหนดค่าแชนเนล และเครื่องหมายจุดลูป ต่างจากรูปแบบคอนเทนเนอร์ที่ซับซ้อน AVR ใช้โครงสร้างไบนารีแบบเรียบไม่มีการบีบอัด รักษาคุณภาพรูปคลื่นเต็มรูปแบบแลกกับไฟล์ที่มีขนาดใหญ่กว่า รูปแบบนี้ให้บริการเวิร์กสเตชันเสียงมืออาชีพบน Macintosh ในช่วงปลายทศวรรษ 1980 ถึงต้นทศวรรษ 1990 เมื่อแพลตฟอร์ม Mac ครองวงการคอมพิวเตอร์เชิงสร้างสรรค์ ข้อดีคือการเก็บข้อมูลแบบไม่บีบอัดที่รับประกันว่าไม่มีสิ่งรบกวนและรักษาความสมบูรณ์ของสัญญาณอย่างสมบูรณ์แบบตลอดการตัดต่อ เครื่องหมายลูปในตัวเป็นอีกคุณสมบัติที่ให้นักออกแบบเสียงกำหนดจุดทำซ้ำอย่างราบรื่นภายในไฟล์ — ล้ำหน้าสำหรับยุคของการผลิตเพลงแบบ sample เครื่องมืออย่าง SoX ยังคงรองรับ AVR ทำให้นักจดหมายเหตุสามารถเข้าถึงและแปลงการบันทึกเสียงเก่าเหล่านี้ได้ แม้จะถูกแทนที่โดย WAV และ AIFF แต่ AVR ยังคงเป็นส่วนสำคัญของประวัติศาสตร์เสียงดิจิทัลยุคแรก
ผู้พัฒนา: Audio Visual Research
เผยแพร่ครั้งแรก: 1989
HTK เป็นคอนเทนเนอร์รูปคลื่นดั้งเดิมของ Hidden Markov Model Toolkit ชุดซอฟต์แวร์ที่พัฒนาที่ภาควิชาวิศวกรรมของมหาวิทยาลัยเคมบริดจ์สำหรับการวิจัยด้านการรู้จำเสียงพูด เผยแพร่ครั้งแรกในปี 1993 HTK กลายเป็นแพลตฟอร์มอ้างอิงในห้องปฏิบัติการภาษาศาสตร์คอมพิวเตอร์ทั่วโลกอย่างรวดเร็ว และรูปแบบไฟล์ก็ได้รับความนิยมตามไปด้วย แต่ละไฟล์เก็บลำดับเวกเตอร์พารามิเตอร์หรือตัวอย่างดิบนำหน้าด้วยส่วนหัว 12 ไบต์ที่ระบุจำนวนเฟรม คาบเฟรมในหน่วย 100 ns จำนวนไบต์ต่อเฟรม และรหัสประเภทที่ระบุชนิดข้อมูล — ตัวเลือกมีตั้งแต่ waveform PCM ไปจนถึง Mel-frequency cepstral coefficients และพลังงาน filter-bank ความอเนกประสงค์นี้ช่วยให้คอนเทนเนอร์เดียวบรรจุทั้งเสียงต้นทางและคุณลักษณะที่สกัดออกมาโดยไม่ต้องเปลี่ยนตัวแยกวิเคราะห์ ส่วนหัวที่เรียบง่ายอย่างจงใจหลีกเลี่ยง alignment padding หรือ optional chunks ทำให้อ่านรูปแบบจาก C, Python หรือ MATLAB ได้ง่ายด้วยโค้ดไบนารี I/O เพียงไม่กี่บรรทัด ข้อดีสามประการที่สนับสนุนความเกี่ยวข้องอย่างต่อเนื่องของ HTK: การผสานรวมอย่างแน่นแฟ้นกับไปป์ไลน์ฝึกอบรมและรู้จำของ HTK เลย์เอาต์ไบต์ที่แน่นอนซึ่งขจัดความคลุมเครือของตัวแยกวิเคราะห์ และการนำไปใช้อย่างแพร่หลายในคอร์ปัสทางวิชาการ
เผยแพร่ครั้งแรก: 1993

คำถามที่พบบ่อย

ทำไมต้องแปลง AVR เป็น HTK?

HTK ใช้ในงานวิจัยรู้จำเสียงพูด การแปลงข้อมูลเสียงพูด AVR เป็น HTK ป้อนเข้าไปป์ไลน์ฝึก ML

อะไรเปิดไฟล์ HTK ได้?

HTK toolkit และ SoX อ่านไฟล์วิจัย HTK ได้

รูปแบบ AVR คืออะไร?

AVR (Audio Visual Research) เป็นรูปแบบเสียงที่พัฒนาสำหรับคอมพิวเตอร์ Atari ST ใช้ในงานเสียงเชิงวิชาการและวิจัย

AVR ยังรองรับในปัจจุบันไหม?

AVR เป็นรูปแบบเฉพาะทางดั้งเดิม SoX และ Audacity อ่านได้บนระบบสมัยใหม่ แต่เครื่องเล่นสื่อหลักไม่รองรับ

แปลงไฟล์ AVR หลายไฟล์พร้อมกันได้ไหม?

ได้ อัปโหลดการบันทึก AVR หลายรายการแล้วแปลงแบบแบตช์ได้พร้อมกัน — มีประสิทธิภาพสำหรับคลังเสียงวิจัย