ตัวแปลง SPH เป็น HTK

แปลงเสียง SPH เป็น HTK บนคลาวด์

เลือกไฟล์ต่างๆ

วางไฟล์ต่างๆ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ

ไปยัง

เสียงแม่นยำ

การแปลง SPH เป็น HTK รักษาความเที่ยงตรงของเสียง อัตราสุ่มตัวอย่างและความลึกบิตถูกจัดการอย่างแม่นยำ

ความเป็นส่วนตัวของไฟล์

ไฟล์ SPH ของคุณจะถูกลบทันทีหลังแปลง ไฟล์ HTK ทั้งหมดจะถูกลบจากเซิร์ฟเวอร์โดยอัตโนมัติภายใน 24 ชั่วโมง

ขับเคลื่อนด้วยคลาวด์

การแปลง SPH เป็น HTK เกิดขึ้นบนเซิร์ฟเวอร์ของเราทั้งหมด อุปกรณ์ในเครื่องของคุณไม่ต้องรับภาระตลอดกระบวนการ

วิธีแปลง SPH เป็น HTK

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

เลือกรูปแบบไฟล์ htk หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ htk ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

SPH เป็นนามสกุลไฟล์สำหรับเสียงที่จัดเก็บในรูปแบบ NIST SPHERE (SPeech HEader REsources) มาตรฐานที่สร้างโดยสถาบันมาตรฐานและเทคโนโลยีแห่งชาติสหรัฐอเมริการาวปี 1990 สร้างขึ้นสำหรับการวิจัยด้านเสียงพูด ไฟล์ SPH มีส่วนหัว ASCII ขนาด 1024 ไบต์ที่บรรจุเมทาดาทา — ตัวระบุฐานข้อมูล จำนวนช่องสัญญาณ อัตราสุ่มตัวอย่าง ลำดับไบต์ และประเภทการบีบอัด — ทำให้ทุกการบันทึกอธิบายตัวเองได้ เสียงพื้นฐานโดยทั่วไปเป็น PCM เชิงเส้น 16 บิตที่สุ่มตัวอย่าง 16 kHz แม้ว่าจะอนุญาตให้ใช้การกำหนดค่าอื่นได้ นักวิจัยที่ NIST, DARPA และมหาวิทยาลัยทั่วโลกพึ่งพา SPH สำหรับการเผยแพร่คลังเสียงพูดเช่น TIMIT, Switchboard และคอลเลกชัน LDC ที่เป็นรากฐานของระบบการรู้จำเสียงพูดอัตโนมัติสมัยใหม่ ข้อดีสำคัญคือส่วนหัวที่อ่านได้ด้วยมนุษย์ ทำให้สคริปต์สามารถแยกวิเคราะห์เมทาดาทาการบันทึกได้โดยไม่ต้องถอดรหัสไบนารี การกำหนดมาตรฐานที่เข้มงวดของรูปแบบยังขจัดความกำกวมเมื่อแชร์ชุดข้อมูลข้ามสถาบันและแพลตฟอร์ม เนื่องจากไฟล์ SPH จัดเก็บ PCM แบบไม่บีบอัด จึงรักษาความเที่ยงตรงของเสียงอย่างเต็มที่ — สิ่งสำคัญอย่างยิ่งเมื่อฝึกแบบจำลองอะคูสติกที่แม้แต่สิ่งแปลกปลอมเล็กน้อยก็อาจบิดเบือนผลลัพธ์ได้

ผู้พัฒนา: National Institute of Standards and Technology

เผยแพร่ครั้งแรก: 1990

HTK เป็นคอนเทนเนอร์รูปคลื่นดั้งเดิมของ Hidden Markov Model Toolkit ชุดซอฟต์แวร์ที่พัฒนาที่ภาควิชาวิศวกรรมของมหาวิทยาลัยเคมบริดจ์สำหรับการวิจัยด้านการรู้จำเสียงพูด เผยแพร่ครั้งแรกในปี 1993 HTK กลายเป็นแพลตฟอร์มอ้างอิงในห้องปฏิบัติการภาษาศาสตร์คอมพิวเตอร์ทั่วโลกอย่างรวดเร็ว และรูปแบบไฟล์ก็ได้รับความนิยมตามไปด้วย แต่ละไฟล์เก็บลำดับเวกเตอร์พารามิเตอร์หรือตัวอย่างดิบนำหน้าด้วยส่วนหัว 12 ไบต์ที่ระบุจำนวนเฟรม คาบเฟรมในหน่วย 100 ns จำนวนไบต์ต่อเฟรม และรหัสประเภทที่ระบุชนิดข้อมูล — ตัวเลือกมีตั้งแต่ waveform PCM ไปจนถึง Mel-frequency cepstral coefficients และพลังงาน filter-bank ความอเนกประสงค์นี้ช่วยให้คอนเทนเนอร์เดียวบรรจุทั้งเสียงต้นทางและคุณลักษณะที่สกัดออกมาโดยไม่ต้องเปลี่ยนตัวแยกวิเคราะห์ ส่วนหัวที่เรียบง่ายอย่างจงใจหลีกเลี่ยง alignment padding หรือ optional chunks ทำให้อ่านรูปแบบจาก C, Python หรือ MATLAB ได้ง่ายด้วยโค้ดไบนารี I/O เพียงไม่กี่บรรทัด ข้อดีสามประการที่สนับสนุนความเกี่ยวข้องอย่างต่อเนื่องของ HTK: การผสานรวมอย่างแน่นแฟ้นกับไปป์ไลน์ฝึกอบรมและรู้จำของ HTK เลย์เอาต์ไบต์ที่แน่นอนซึ่งขจัดความคลุมเครือของตัวแยกวิเคราะห์ และการนำไปใช้อย่างแพร่หลายในคอร์ปัสทางวิชาการ

ผู้พัฒนา: Cambridge University Engineering Department

เผยแพร่ครั้งแรก: 1993

คำถามที่พบบ่อย

ทำไมต้องแปลง SPH เป็น HTK?

SPH และ HTK ต่างใช้ในงานวิจัยเสียงพูดแต่ใช้ระบบนิเวศที่แตกต่างกัน รูปแบบ HTK ทำงานร่วมกับชุดเครื่องมือวิเคราะห์ HTK โดยตรง

เปิดไฟล์เสียง HTK ด้วยอะไรได้บ้าง?

เปิด HTK ได้ด้วยชุดเครื่องมือรู้จำเสียงพูด HTK, SoX หรือเครื่องมือวิจัยวิทยาศาสตร์เสียงพูด

การแปลง SPH เป็น HTK ใช้เวลานานไหม?

การแปลงรวดเร็วมาก — เซิร์ฟเวอร์ของเราจัดการการแปลง SPH เป็น HTK อย่างรวดเร็ว ไฟล์เสียงทั่วไปเสร็จภายในไม่กี่วินาที

ใช้อุปกรณ์อะไรแปลง SPH เป็น HTK ได้บ้าง?

ใช้ได้ทุกอุปกรณ์ เปิดตัวแปลงในเบราว์เซอร์สมัยใหม่บน PC, Mac, Chromebook, แท็บเล็ต หรือสมาร์ทโฟน

สามารถเปลี่ยนการตั้งค่าเสียงก่อนแปลง SPH เป็น HTK ได้ไหม?

ได้ — คุณสามารถปรับอัตราสุ่มตัวอย่าง ความลึกบิต และการตั้งค่าช่องเสียงก่อนเริ่มแปลง SPH เป็น HTK

การแปลง SPH เป็น HTK เป็นแบบไม่สูญเสียคุณภาพหรือไม่?

ขึ้นอยู่กับเป้าหมาย การแปลง SPH เป็นรูปแบบ HTK แบบ lossless จะรักษาข้อมูลทั้งหมด โคเดกแบบ lossy จะแลกคุณภาพเล็กน้อยเพื่อขนาดเล็กลง

การแปลงที่เกี่ยวข้อง

SPH เป็น WAV

SPH เป็น MP3

SPH เป็น FLAC

SPH เป็น M4A

SPH เป็น PVF

SPH เป็น AAC

SPH เป็น AC3

SPH เป็น OGG

SPH เป็น AIFF

SPH เป็น AMR

SPH เป็น M4R

SPH เป็น WMA

SPH เป็น DTS

SPH เป็น OPUS

SPH เป็น SPX

SPH เป็น CAF

SPH เป็น W64

SPH เป็น WV

SPH เป็น VOC

SPH เป็น TTA

SPH เป็น RA

SPH เป็น MP2

SPH เป็น OGA

SPH เป็น PRC

SPH เป็น MAUD

SPH เป็น 8SVX

SPH เป็น AMB

SPH เป็น AU

SPH เป็น SND

SPH เป็น SNDR

SPH เป็น SNDT

SPH เป็น AVR

SPH เป็น CDDA

SPH เป็น CVS

SPH เป็น CVSD

SPH เป็น CVU

SPH เป็น DVMS

SPH เป็น VMS

SPH เป็น FAP

SPH เป็น PAF

SPH เป็น FSSD

SPH เป็น SOU

SPH เป็น GSRT

SPH เป็น GSM

SPH เป็น HCOM

SPH เป็น HTK

SPH เป็น IMA

SPH เป็น IRCAM

SPH เป็น SLN

SPH เป็น NIST

SPH เป็น SMP

SPH เป็น TXW

SPH เป็น VOX

SPH เป็น WVE

SPH เป็น SD2

ตัวแปลงเฉพาะ

MP3 เป็น HTK

WAV เป็น HTK

MP4 เป็น HTK

FLAC เป็น HTK

M4A เป็น HTK

OGG เป็น HTK

MPG เป็น HTK

ASF เป็น HTK

AAC เป็น HTK

3G2 เป็น HTK

3GP เป็น HTK

AAF เป็น HTK

AV1 เป็น HTK

AVCHD เป็น HTK

AVI เป็น HTK

CAVS เป็น HTK

DIVX เป็น HTK

DV เป็น HTK

F4V เป็น HTK

FLV เป็น HTK

HEVC เป็น HTK

M2TS เป็น HTK

M2V เป็น HTK

M4V เป็น HTK

MJPEG เป็น HTK

MKV เป็น HTK

MOD เป็น HTK

MOV เป็น HTK

MPEG เป็น HTK

MPEG-2 เป็น HTK