SPX to HTK Converter

แปลงการบันทึก Speex เป็นรูปแบบ HTK speech recognition

เลือกไฟล์ต่างๆ

วางไฟล์ต่างๆ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ

ไปยัง

เสียงพร้อมสำหรับวิจัย

แปลงการบันทึกเสียงพูด Speex เป็นรูปแบบ HTK — พร้อมสำหรับการฝึก speech recognition การทดสอบ และงานวิจัยเสียง

เครื่องมือ Speech Science

เชื่อมช่องว่างระหว่างการบันทึก VoIP ใน SPX และรูปแบบ HTK ที่ใช้โดยกลุ่มวิจัย speech recognition ชั้นนำ

จัดการข้อมูลส่วนตัว

ข้อมูลเสียงพูด SPX ของคุณจะถูกลบหลังการแปลง เอาต์พุต HTK จะถูกลบออกจากเซิร์ฟเวอร์ภายใน 24 ชั่วโมง

วิธีแปลง SPX เป็น HTK

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

เลือกรูปแบบไฟล์ htk หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ htk ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

Speex เป็นโคเดกเสียงโอเพนซอร์สที่สร้างขึ้นโดยเฉพาะสำหรับการบีบอัดเสียงพูด พัฒนาโดย Jean-Marc Valin ภายใต้ Xiph.Org Foundation เปิดตัวครั้งแรกในเดือนตุลาคม 2002 โดยมุ่งเป้าไปที่การสื่อสารด้วยเสียงผ่าน IP การประชุมทางเสียง และทุกสถานการณ์ที่ต้องส่งเสียงพูดอย่างมีประสิทธิภาพผ่านเครือข่าย ไฟล์ SPX บรรจุเสียงที่เข้ารหัสด้วย Speex ในคอนเทนเนอร์ Ogg ผสมผสานการปรับแต่งเสียงพูดของโคเดกกับความสามารถในการสตรีมของ Ogg รองรับอัตราสุ่มตัวอย่างสามระดับ — แบนด์แคบที่ 8 kHz แบนด์กว้างที่ 16 kHz และอัลตราแบนด์กว้างที่ 32 kHz — พร้อมการเข้ารหัสบิตเรตแปรผันที่ปรับตัวแบบเรียลไทม์ตามความซับซ้อนของเสียงพูด ข้อดีที่โดดเด่นคือลักษณะที่ปลอดสิทธิบัตรภายใต้สัญญาอนุญาต BSD ซึ่งให้นักพัฒนาฝังไว้ในผลิตภัณฑ์ทั้งเชิงพาณิชย์และโอเพนซอร์สได้อย่างอิสระ Speex ยังรวมการตัดเสียงสะท้อน การระงับเสียงรบกวน และการควบคุมอัตราขยายอัตโนมัติ — ฟีเจอร์ที่โคเดกคู่แข่งมักมอบหมายให้ไลบรารีภายนอก แม้ว่าผู้สร้างจะแนะนำ Opus อย่างเป็นทางการเป็นตัวสืบทอดตั้งแต่ปี 2012 แต่ Speex ยังคงถูกใช้งานในระบบ VoIP เดิม การบันทึกที่เก็บถาวร และอุปกรณ์ฝังตัวที่ตัวถอดรหัสที่ใช้ทรัพยากรน้อยยังคงมีคุณค่า

ผู้พัฒนา: Xiph.Org Foundation

เผยแพร่ครั้งแรก: 15 ตุลาคม 2002

HTK เป็นคอนเทนเนอร์รูปคลื่นดั้งเดิมของ Hidden Markov Model Toolkit ชุดซอฟต์แวร์ที่พัฒนาที่ภาควิชาวิศวกรรมของมหาวิทยาลัยเคมบริดจ์สำหรับการวิจัยด้านการรู้จำเสียงพูด เผยแพร่ครั้งแรกในปี 1993 HTK กลายเป็นแพลตฟอร์มอ้างอิงในห้องปฏิบัติการภาษาศาสตร์คอมพิวเตอร์ทั่วโลกอย่างรวดเร็ว และรูปแบบไฟล์ก็ได้รับความนิยมตามไปด้วย แต่ละไฟล์เก็บลำดับเวกเตอร์พารามิเตอร์หรือตัวอย่างดิบนำหน้าด้วยส่วนหัว 12 ไบต์ที่ระบุจำนวนเฟรม คาบเฟรมในหน่วย 100 ns จำนวนไบต์ต่อเฟรม และรหัสประเภทที่ระบุชนิดข้อมูล — ตัวเลือกมีตั้งแต่ waveform PCM ไปจนถึง Mel-frequency cepstral coefficients และพลังงาน filter-bank ความอเนกประสงค์นี้ช่วยให้คอนเทนเนอร์เดียวบรรจุทั้งเสียงต้นทางและคุณลักษณะที่สกัดออกมาโดยไม่ต้องเปลี่ยนตัวแยกวิเคราะห์ ส่วนหัวที่เรียบง่ายอย่างจงใจหลีกเลี่ยง alignment padding หรือ optional chunks ทำให้อ่านรูปแบบจาก C, Python หรือ MATLAB ได้ง่ายด้วยโค้ดไบนารี I/O เพียงไม่กี่บรรทัด ข้อดีสามประการที่สนับสนุนความเกี่ยวข้องอย่างต่อเนื่องของ HTK: การผสานรวมอย่างแน่นแฟ้นกับไปป์ไลน์ฝึกอบรมและรู้จำของ HTK เลย์เอาต์ไบต์ที่แน่นอนซึ่งขจัดความคลุมเครือของตัวแยกวิเคราะห์ และการนำไปใช้อย่างแพร่หลายในคอร์ปัสทางวิชาการ

ผู้พัฒนา: Cambridge University Engineering Department

เผยแพร่ครั้งแรก: 1993

คำถามที่พบบ่อย

ทำไมต้องแปลง SPX เป็น HTK?

HTK คือรูปแบบมาตรฐานสำหรับ Hidden Markov Model Toolkit ที่ใช้กันอย่างแพร่หลายในงานวิจัย speech recognition และ NLP

HTK toolkit คืออะไร?

HTK (Hidden Markov Model Toolkit) คือ speech recognition framework จากมหาวิทยาลัย Cambridge ที่ใช้ทั่วโลกในงานวิจัยเสียง

ซอฟต์แวร์อะไรต้องการไฟล์ HTK?

HTK toolkit เอง, Kaldi และ speech processing framework เชิงวิชาการต่างๆ รองรับ HTK-formatted audio input

ข้อมูลเสียงพูด SPX ฝึก model ได้ไหม?

ใช่ — การบันทึกเสียงพูด SPX ที่แปลงเป็น HTK สามารถใช้เป็นข้อมูล training หรือ evaluation สำหรับ speech recognition model

แปลงฟรีไหม?

ใช่ — ฟรีที่ convertio.cloud สำหรับการใช้งานมาตรฐาน

การแปลงที่เกี่ยวข้อง

SPX เป็น MP3

SPX เป็น WAV

SPX เป็น AAC

SPX เป็น M4A

SPX เป็น OGG

SPX เป็น W64

SPX เป็น OPUS

SPX เป็น OGA

SPX เป็น MP2

SPX เป็น GSM

SPX เป็น FLAC

SPX เป็น DTS

SPX เป็น CAF

SPX เป็น AMR

SPX เป็น AC3

SPX เป็น WMA

SPX เป็น AIFF

SPX เป็น M4R

SPX เป็น WV

SPX เป็น VOC

SPX เป็น TTA

SPX เป็น RA

SPX เป็น PVF

SPX เป็น PRC

SPX เป็น MAUD

SPX เป็น 8SVX

SPX เป็น AMB

SPX เป็น AU

SPX เป็น SND

SPX เป็น SNDR

SPX เป็น SNDT

SPX เป็น AVR

SPX เป็น CDDA

SPX เป็น CVS

SPX เป็น CVSD

SPX เป็น CVU

SPX เป็น DVMS

SPX เป็น VMS

SPX เป็น FAP

SPX เป็น PAF

SPX เป็น FSSD

SPX เป็น SOU

SPX เป็น GSRT

SPX เป็น HCOM

SPX เป็น HTK

SPX เป็น IMA

SPX เป็น IRCAM

SPX เป็น SLN

SPX เป็น SPH

SPX เป็น NIST

SPX เป็น SMP

SPX เป็น TXW

SPX เป็น VOX

SPX เป็น WVE

SPX เป็น SD2

ตัวแปลงเฉพาะ

MP3 เป็น HTK

WAV เป็น HTK

MP4 เป็น HTK

FLAC เป็น HTK

M4A เป็น HTK

OGG เป็น HTK

MPG เป็น HTK

ASF เป็น HTK

AAC เป็น HTK

3G2 เป็น HTK

3GP เป็น HTK

AAF เป็น HTK

AV1 เป็น HTK

AVCHD เป็น HTK

AVI เป็น HTK

CAVS เป็น HTK

DIVX เป็น HTK

DV เป็น HTK

F4V เป็น HTK

FLV เป็น HTK

HEVC เป็น HTK

M2TS เป็น HTK

M2V เป็น HTK

M4V เป็น HTK

MJPEG เป็น HTK

MKV เป็น HTK

MOD เป็น HTK

MOV เป็น HTK

MPEG เป็น HTK

MPEG-2 เป็น HTK