ตัวแปลง GSM เป็น HTK

เตรียมเสียงพูด GSM สำหรับชุดเครื่องมือวิจัย HTK ออนไลน์

เลือกไฟล์ต่างๆ

วางไฟล์ต่างๆ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ

ไปยัง

พร้อมสำหรับงานวิจัยเสียงพูด

แปลงเสียงโทรศัพท์ GSM เป็นรูปแบบ HTK — เตรียมบันทึกเสียงสำหรับไปป์ไลน์วิจัย Hidden Markov Model Toolkit

มาตรฐานทางวิชาการ

HTK เป็นรูปแบบที่ได้รับการยอมรับสำหรับงานวิจัยการรู้จำเสียงพูด การแปลง GSM เป็น HTK เชื่อมข้อมูลโทรศัพท์กับการวิเคราะห์ทางวิชาการ

ประมวลผลอย่างเป็นความลับ

ไฟล์ GSM ที่อัปโหลดจะถูกลบหลังการแปลง ผลลัพธ์ HTK จะถูกลบจากเซิร์ฟเวอร์ภายใน 24 ชั่วโมง

วิธีแปลง GSM เป็น HTK

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

เลือกรูปแบบไฟล์ htk หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ htk ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

GSM 06.10 (Full Rate) เป็นตัวแปลงสัญญาณเสียงพูดพื้นฐานของมาตรฐาน Global System for Mobile Communications ได้รับการรับรองโดย ETSI ในปี 1991 และใช้งานในเครือข่ายเซลลูลาร์หลายร้อยแห่งทั่วโลก ทำงานที่อัตราคงที่ 13 kbit/s อัลกอริทึมใช้ Regular Pulse Excitation with Long-Term Prediction (RPE-LTP) เพื่อบีบอัดเฟรมเสียงพูดขนาด 20 ms ที่ 8 kHz โมโนเหลือเพียง 33 ไบต์ต่อเฟรม วิธีนี้สร้างแบบจำลองช่องเสียงเป็น linear predictive filter เข้ารหัสสัญญาณกระตุ้น และใช้ประโยชน์จากคาบพิทช์เพื่อลดขนาดเพิ่มเติม — ปรับให้ส่งเสียงพูดที่ชัดเจนภายใต้ข้อจำกัดแบนด์วิดท์ของช่องสัญญาณมือถือดิจิทัลยุคแรก ตัวแปลงสัญญาณนี้ขับเคลื่อนไม่เพียงระบบโทรศัพท์ GSM เท่านั้น แต่ยังรวมถึงแอปพลิเคชัน VoIP ระบบวอยซ์เมล และแพลตฟอร์ม IVR จำนวนมากที่ได้ประโยชน์จากบิตเรตต่ำ ข้อดีที่โดดเด่นสามประการ ประการแรก การบีบอัดที่เหนือชั้น: เสียงพูดหนึ่งนาทีใช้พื้นที่เพียงประมาณ 100 KB ทำให้จัดเก็บและส่งข้อมูลได้อย่างมีประสิทธิภาพ ประการที่สอง เครื่องมือที่ใช้ได้ทั่วไป — ไลบรารีอย่าง libgsm และ SoX จัดการการเข้ารหัสและถอดรหัสบนทุกแพลตฟอร์มหลัก ประการที่สาม สิทธิบัตรที่ไม่มีค่าลิขสิทธิ์ซึ่งส่งเสริมการนำไปใช้ในโปรเจกต์โทรศัพท์โอเพนซอร์สอย่าง Asterisk และ FreeSWITCH

ผู้พัฒนา: European Telecommunications Standards Institute

เผยแพร่ครั้งแรก: 1991

HTK เป็นคอนเทนเนอร์รูปคลื่นดั้งเดิมของ Hidden Markov Model Toolkit ชุดซอฟต์แวร์ที่พัฒนาที่ภาควิชาวิศวกรรมของมหาวิทยาลัยเคมบริดจ์สำหรับการวิจัยด้านการรู้จำเสียงพูด เผยแพร่ครั้งแรกในปี 1993 HTK กลายเป็นแพลตฟอร์มอ้างอิงในห้องปฏิบัติการภาษาศาสตร์คอมพิวเตอร์ทั่วโลกอย่างรวดเร็ว และรูปแบบไฟล์ก็ได้รับความนิยมตามไปด้วย แต่ละไฟล์เก็บลำดับเวกเตอร์พารามิเตอร์หรือตัวอย่างดิบนำหน้าด้วยส่วนหัว 12 ไบต์ที่ระบุจำนวนเฟรม คาบเฟรมในหน่วย 100 ns จำนวนไบต์ต่อเฟรม และรหัสประเภทที่ระบุชนิดข้อมูล — ตัวเลือกมีตั้งแต่ waveform PCM ไปจนถึง Mel-frequency cepstral coefficients และพลังงาน filter-bank ความอเนกประสงค์นี้ช่วยให้คอนเทนเนอร์เดียวบรรจุทั้งเสียงต้นทางและคุณลักษณะที่สกัดออกมาโดยไม่ต้องเปลี่ยนตัวแยกวิเคราะห์ ส่วนหัวที่เรียบง่ายอย่างจงใจหลีกเลี่ยง alignment padding หรือ optional chunks ทำให้อ่านรูปแบบจาก C, Python หรือ MATLAB ได้ง่ายด้วยโค้ดไบนารี I/O เพียงไม่กี่บรรทัด ข้อดีสามประการที่สนับสนุนความเกี่ยวข้องอย่างต่อเนื่องของ HTK: การผสานรวมอย่างแน่นแฟ้นกับไปป์ไลน์ฝึกอบรมและรู้จำของ HTK เลย์เอาต์ไบต์ที่แน่นอนซึ่งขจัดความคลุมเครือของตัวแยกวิเคราะห์ และการนำไปใช้อย่างแพร่หลายในคอร์ปัสทางวิชาการ

ผู้พัฒนา: Cambridge University Engineering Department

เผยแพร่ครั้งแรก: 1993

คำถามที่พบบ่อย

HTK คืออะไร?

HTK คือรูปแบบ Hidden Markov Model Toolkit — มาตรฐานทางวิชาการสำหรับการประมวลผลเสียงพูด งานวิจัยการรู้จำ และการวิเคราะห์เสียง

ทำไมต้องแปลง GSM เป็น HTK?

รูปแบบ HTK จำเป็นสำหรับซอฟต์แวร์ HMM Toolkit การแปลงเตรียมเสียงพูดโทรศัพท์ GSM สำหรับการวิเคราะห์ในไปป์ไลน์วิจัย HTK

ซอฟต์แวร์อะไรใช้ไฟล์ HTK?

ชุดเครื่องมือรู้จำเสียงพูด HTK จากมหาวิทยาลัย Cambridge พร้อมกับ Kaldi และเครื่องมือวิชาการอื่นสามารถประมวลผลไฟล์ HTK

HTK เหมาะสำหรับเสียงทั่วไปไหม?

ไม่ HTK เป็นรูปแบบวิจัยเสียงพูดทางวิชาการโดยเฉพาะ — ช่องเดียว PCM 16-bit ออกแบบสำหรับการวิเคราะห์เชิงคำนวณ

บันทึกเสียงวิจัยของฉันจะเป็นส่วนตัวไหม?

ไฟล์ GSM ที่อัปโหลดทั้งหมดจะถูกลบหลังการแปลง ผลลัพธ์ HTK จะถูกลบจากเซิร์ฟเวอร์ภายใน 24 ชั่วโมง

การแปลงที่เกี่ยวข้อง

GSM เป็น MP3

GSM เป็น WAV

GSM เป็น WMA

GSM เป็น OGG

GSM เป็น M4A

GSM เป็น AMR

GSM เป็น VOC

GSM เป็น AIFF

GSM เป็น OPUS

GSM เป็น RA

GSM เป็น SLN

GSM เป็น W64

GSM เป็น VOX

GSM เป็น 8SVX

GSM เป็น SPX

GSM เป็น PRC

GSM เป็น M4R

GSM เป็น FLAC

GSM เป็น AAC

GSM เป็น WV

GSM เป็น AC3

GSM เป็น DTS

GSM เป็น CAF

GSM เป็น TTA

GSM เป็น MP2

GSM เป็น OGA

GSM เป็น PVF

GSM เป็น MAUD

GSM เป็น AMB

GSM เป็น AU

GSM เป็น SND

GSM เป็น SNDR

GSM เป็น SNDT

GSM เป็น AVR

GSM เป็น CDDA

GSM เป็น CVS

GSM เป็น CVSD

GSM เป็น CVU

GSM เป็น DVMS

GSM เป็น VMS

GSM เป็น FAP

GSM เป็น PAF

GSM เป็น FSSD

GSM เป็น SOU

GSM เป็น GSRT

GSM เป็น HCOM

GSM เป็น HTK

GSM เป็น IMA

GSM เป็น IRCAM

GSM เป็น SPH

GSM เป็น NIST

GSM เป็น SMP

GSM เป็น TXW

GSM เป็น WVE

GSM เป็น SD2

ตัวแปลงเฉพาะ

MP3 เป็น HTK

WAV เป็น HTK

MP4 เป็น HTK

FLAC เป็น HTK

M4A เป็น HTK

OGG เป็น HTK

MPG เป็น HTK

ASF เป็น HTK

AAC เป็น HTK

3G2 เป็น HTK

3GP เป็น HTK

AAF เป็น HTK

AV1 เป็น HTK

AVCHD เป็น HTK

AVI เป็น HTK

CAVS เป็น HTK

DIVX เป็น HTK

DV เป็น HTK

F4V เป็น HTK

FLV เป็น HTK

HEVC เป็น HTK

M2TS เป็น HTK

M2V เป็น HTK

M4V เป็น HTK

MJPEG เป็น HTK

MKV เป็น HTK

MOD เป็น HTK

MOV เป็น HTK

MPEG เป็น HTK

MPEG-2 เป็น HTK