ตัวแปลง GSM เป็น HTK

เตรียมเสียงพูด GSM สำหรับชุดเครื่องมือวิจัย HTK ออนไลน์

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

พร้อมสำหรับงานวิจัยเสียงพูด

แปลงเสียงโทรศัพท์ GSM เป็นรูปแบบ HTK — เตรียมบันทึกเสียงสำหรับไปป์ไลน์วิจัย Hidden Markov Model Toolkit

มาตรฐานทางวิชาการ

HTK เป็นรูปแบบที่ได้รับการยอมรับสำหรับงานวิจัยการรู้จำเสียงพูด การแปลง GSM เป็น HTK เชื่อมข้อมูลโทรศัพท์กับการวิเคราะห์ทางวิชาการ

ประมวลผลอย่างเป็นความลับ

ไฟล์ GSM ที่อัปโหลดจะถูกลบหลังการแปลง ผลลัพธ์ HTK จะถูกลบจากเซิร์ฟเวอร์ภายใน 24 ชั่วโมง

วิธีแปลง GSM เป็น HTK

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ htk หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ htk ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

GSM 06.10 (Full Rate) เป็นตัวแปลงสัญญาณเสียงพูดพื้นฐานของมาตรฐาน Global System for Mobile Communications ได้รับการรับรองโดย ETSI ในปี 1991 และใช้งานในเครือข่ายเซลลูลาร์หลายร้อยแห่งทั่วโลก ทำงานที่อัตราคงที่ 13 kbit/s อัลกอริทึมใช้ Regular Pulse Excitation with Long-Term Prediction (RPE-LTP) เพื่อบีบอัดเฟรมเสียงพูดขนาด 20 ms ที่ 8 kHz โมโนเหลือเพียง 33 ไบต์ต่อเฟรม วิธีนี้สร้างแบบจำลองช่องเสียงเป็น linear predictive filter เข้ารหัสสัญญาณกระตุ้น และใช้ประโยชน์จากคาบพิทช์เพื่อลดขนาดเพิ่มเติม — ปรับให้ส่งเสียงพูดที่ชัดเจนภายใต้ข้อจำกัดแบนด์วิดท์ของช่องสัญญาณมือถือดิจิทัลยุคแรก ตัวแปลงสัญญาณนี้ขับเคลื่อนไม่เพียงระบบโทรศัพท์ GSM เท่านั้น แต่ยังรวมถึงแอปพลิเคชัน VoIP ระบบวอยซ์เมล และแพลตฟอร์ม IVR จำนวนมากที่ได้ประโยชน์จากบิตเรตต่ำ ข้อดีที่โดดเด่นสามประการ ประการแรก การบีบอัดที่เหนือชั้น: เสียงพูดหนึ่งนาทีใช้พื้นที่เพียงประมาณ 100 KB ทำให้จัดเก็บและส่งข้อมูลได้อย่างมีประสิทธิภาพ ประการที่สอง เครื่องมือที่ใช้ได้ทั่วไป — ไลบรารีอย่าง libgsm และ SoX จัดการการเข้ารหัสและถอดรหัสบนทุกแพลตฟอร์มหลัก ประการที่สาม สิทธิบัตรที่ไม่มีค่าลิขสิทธิ์ซึ่งส่งเสริมการนำไปใช้ในโปรเจกต์โทรศัพท์โอเพนซอร์สอย่าง Asterisk และ FreeSWITCH
เผยแพร่ครั้งแรก: 1991
HTK เป็นคอนเทนเนอร์รูปคลื่นดั้งเดิมของ Hidden Markov Model Toolkit ชุดซอฟต์แวร์ที่พัฒนาที่ภาควิชาวิศวกรรมของมหาวิทยาลัยเคมบริดจ์สำหรับการวิจัยด้านการรู้จำเสียงพูด เผยแพร่ครั้งแรกในปี 1993 HTK กลายเป็นแพลตฟอร์มอ้างอิงในห้องปฏิบัติการภาษาศาสตร์คอมพิวเตอร์ทั่วโลกอย่างรวดเร็ว และรูปแบบไฟล์ก็ได้รับความนิยมตามไปด้วย แต่ละไฟล์เก็บลำดับเวกเตอร์พารามิเตอร์หรือตัวอย่างดิบนำหน้าด้วยส่วนหัว 12 ไบต์ที่ระบุจำนวนเฟรม คาบเฟรมในหน่วย 100 ns จำนวนไบต์ต่อเฟรม และรหัสประเภทที่ระบุชนิดข้อมูล — ตัวเลือกมีตั้งแต่ waveform PCM ไปจนถึง Mel-frequency cepstral coefficients และพลังงาน filter-bank ความอเนกประสงค์นี้ช่วยให้คอนเทนเนอร์เดียวบรรจุทั้งเสียงต้นทางและคุณลักษณะที่สกัดออกมาโดยไม่ต้องเปลี่ยนตัวแยกวิเคราะห์ ส่วนหัวที่เรียบง่ายอย่างจงใจหลีกเลี่ยง alignment padding หรือ optional chunks ทำให้อ่านรูปแบบจาก C, Python หรือ MATLAB ได้ง่ายด้วยโค้ดไบนารี I/O เพียงไม่กี่บรรทัด ข้อดีสามประการที่สนับสนุนความเกี่ยวข้องอย่างต่อเนื่องของ HTK: การผสานรวมอย่างแน่นแฟ้นกับไปป์ไลน์ฝึกอบรมและรู้จำของ HTK เลย์เอาต์ไบต์ที่แน่นอนซึ่งขจัดความคลุมเครือของตัวแยกวิเคราะห์ และการนำไปใช้อย่างแพร่หลายในคอร์ปัสทางวิชาการ
เผยแพร่ครั้งแรก: 1993

คำถามที่พบบ่อย

HTK คืออะไร?

HTK คือรูปแบบ Hidden Markov Model Toolkit — มาตรฐานทางวิชาการสำหรับการประมวลผลเสียงพูด งานวิจัยการรู้จำ และการวิเคราะห์เสียง

ทำไมต้องแปลง GSM เป็น HTK?

รูปแบบ HTK จำเป็นสำหรับซอฟต์แวร์ HMM Toolkit การแปลงเตรียมเสียงพูดโทรศัพท์ GSM สำหรับการวิเคราะห์ในไปป์ไลน์วิจัย HTK

ซอฟต์แวร์อะไรใช้ไฟล์ HTK?

ชุดเครื่องมือรู้จำเสียงพูด HTK จากมหาวิทยาลัย Cambridge พร้อมกับ Kaldi และเครื่องมือวิชาการอื่นสามารถประมวลผลไฟล์ HTK

HTK เหมาะสำหรับเสียงทั่วไปไหม?

ไม่ HTK เป็นรูปแบบวิจัยเสียงพูดทางวิชาการโดยเฉพาะ — ช่องเดียว PCM 16-bit ออกแบบสำหรับการวิเคราะห์เชิงคำนวณ

บันทึกเสียงวิจัยของฉันจะเป็นส่วนตัวไหม?

ไฟล์ GSM ที่อัปโหลดทั้งหมดจะถูกลบหลังการแปลง ผลลัพธ์ HTK จะถูกลบจากเซิร์ฟเวอร์ภายใน 24 ชั่วโมง