ตัวแปลง WVE เป็น HTK

แปลงเสียง WVE ของ Psion เป็นรูปแบบวิจัย HTK

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

กู้คืนเสียง PDA

ดึงเสียงจากไฟล์ WVE ของ Psion รุ่นเก่าและแปลงเป็น HTK — ทำให้บันทึกเสียงวินเทจ PDA เข้าถึงได้ในรูปแบบที่รองรับ

ไม่ต้องใช้ PsiWin

แปลงไฟล์ WVE โดยไม่ต้องใช้ PsiWin หรือ SoX กระบวนการทั้งหมดทำงานในเว็บเบราว์เซอร์บนระบบปฏิบัติการใดก็ได้

ประมวลผลอย่างปลอดภัย

ไฟล์ WVE ที่อัปโหลดจะถูกลบทันทีหลังการแปลง ไฟล์เอาต์พุตจะถูกลบออกจากเซิร์ฟเวอร์ภายใน 24 ชั่วโมง

วิธีแปลง WVE เป็น HTK

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ htk หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ htk ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

WVE เป็นรูปแบบเสียงดั้งเดิมของตระกูล Psion Series 3 ผู้ช่วยดิจิทัลส่วนบุคคล ที่เปิดตัวโดยบริษัท Psion PLC ของอังกฤษเริ่มตั้งแต่เดือนกันยายน 1991 PDA แบบฝาพับเหล่านี้มีเครื่องบันทึกเสียงในตัว และฟังก์ชันการบอกเล่าทั้งหมดอาศัยไฟล์ WVE ในการจัดเก็บเสียงที่บันทึก แต่ละไฟล์เริ่มต้นด้วยลายเซ็น ASCII "ALawSoundFile**" ตามด้วยส่วนหัวขั้นต่ำ จากนั้นเป็นเสียงดิบที่เข้ารหัส A-law ที่สุ่มตัวอย่าง 8 kHz — อัตราที่สืบทอดมาจากมาตรฐานโทรศัพท์ดิจิทัล ที่ 8000 ไบต์ต่อวินาที การบันทึกหนึ่งนาทีใช้พื้นที่เพียง 480 KB ซึ่งจำเป็นอย่างยิ่งเมื่อพิจารณาว่าอุปกรณ์ Psion จัดเก็บข้อมูลบนการ์ด SRAM ที่โดยทั่วไปมีความจุ 128 KB ถึง 2 MB การเข้ารหัส A-law ให้ความชัดเจนของเสียงพูดที่สมเหตุสมผลภายในข้อจำกัดการจัดเก็บที่จำกัดเหล่านี้ โดยให้ความสำคัญกับความเข้าใจได้มากกว่าการสร้างเสียงคุณภาพสูง ไฟล์ WVE สามารถแปลงเป็น WAV หรือรูปแบบสมัยใหม่อื่นๆ ได้โดยใช้ SoX, Awave Studio หรือยูทิลิตีไฟล์ Psion เฉพาะทาง แม้ว่ารูปแบบนี้จะเป็นผลิตภัณฑ์ของยุคคอมพิวเตอร์พกพาต้นทศวรรษ 1990 อย่างแท้จริง แต่มีความสำคัญทางประวัติศาสตร์ในฐานะหนึ่งในรูปแบบบันทึกเสียงแรกๆ ที่ออกแบบมาสำหรับอุปกรณ์ผู้บริโภคขนาดพกพา นักสะสมและนักวิจัยที่ศึกษาประวัติศาสตร์คอมพิวเตอร์เคลื่อนที่พบไฟล์ WVE เป็นครั้งคราวเมื่อกู้คืนข้อมูลจากสื่อ SRAM เก่า
ผู้พัฒนา: Psion PLC
เผยแพร่ครั้งแรก: 1991
HTK เป็นคอนเทนเนอร์รูปคลื่นดั้งเดิมของ Hidden Markov Model Toolkit ชุดซอฟต์แวร์ที่พัฒนาที่ภาควิชาวิศวกรรมของมหาวิทยาลัยเคมบริดจ์สำหรับการวิจัยด้านการรู้จำเสียงพูด เผยแพร่ครั้งแรกในปี 1993 HTK กลายเป็นแพลตฟอร์มอ้างอิงในห้องปฏิบัติการภาษาศาสตร์คอมพิวเตอร์ทั่วโลกอย่างรวดเร็ว และรูปแบบไฟล์ก็ได้รับความนิยมตามไปด้วย แต่ละไฟล์เก็บลำดับเวกเตอร์พารามิเตอร์หรือตัวอย่างดิบนำหน้าด้วยส่วนหัว 12 ไบต์ที่ระบุจำนวนเฟรม คาบเฟรมในหน่วย 100 ns จำนวนไบต์ต่อเฟรม และรหัสประเภทที่ระบุชนิดข้อมูล — ตัวเลือกมีตั้งแต่ waveform PCM ไปจนถึง Mel-frequency cepstral coefficients และพลังงาน filter-bank ความอเนกประสงค์นี้ช่วยให้คอนเทนเนอร์เดียวบรรจุทั้งเสียงต้นทางและคุณลักษณะที่สกัดออกมาโดยไม่ต้องเปลี่ยนตัวแยกวิเคราะห์ ส่วนหัวที่เรียบง่ายอย่างจงใจหลีกเลี่ยง alignment padding หรือ optional chunks ทำให้อ่านรูปแบบจาก C, Python หรือ MATLAB ได้ง่ายด้วยโค้ดไบนารี I/O เพียงไม่กี่บรรทัด ข้อดีสามประการที่สนับสนุนความเกี่ยวข้องอย่างต่อเนื่องของ HTK: การผสานรวมอย่างแน่นแฟ้นกับไปป์ไลน์ฝึกอบรมและรู้จำของ HTK เลย์เอาต์ไบต์ที่แน่นอนซึ่งขจัดความคลุมเครือของตัวแยกวิเคราะห์ และการนำไปใช้อย่างแพร่หลายในคอร์ปัสทางวิชาการ
เผยแพร่ครั้งแรก: 1993

คำถามที่พบบ่อย

ทำไมต้องแปลง WVE เป็น HTK?

HTK ใช้สำหรับการวิจัยการรู้จำเสียงพูด การแปลงข้อมูลเสียงพูด WVE ป้อนเข้าสู่ไปป์ไลน์การฝึก ML

โปรแกรมใดเปิดไฟล์ HTK ได้?

HTK toolkit และ SoX อ่านไฟล์วิจัย HTK

รูปแบบ WVE คืออะไร?

WVE คือรูปแบบเสียงดั้งเดิมของอุปกรณ์ Psion PDA (Series 3, 5, Revo) บันทึกเสียงแบบ 8-bit A-law จากระบบปฏิบัติการ EPOC

ระบบปัจจุบันเล่น WVE ได้ไหม?

SoX และ PsiWin บน Windows สามารถประมวลผลไฟล์ WVE ได้ แต่โปรแกรมเล่นสื่อทั่วไปไม่รองรับ — การแปลงคือวิธีที่ง่ายที่สุด

แปลง WVE หลายไฟล์พร้อมกันได้ไหม?

ได้ อัปโหลดบันทึกเสียง Psion หลายไฟล์และแปลงทั้งหมดในครั้งเดียว เหมาะสำหรับการเก็บถาวรคลังเสียง PDA ทั้งหมด