ตัวแปลง SHN เป็น HTK

เข้ารหัสเสียง Shorten เป็น HTK สำหรับวิจัยเสียงพูดออนไลน์

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

ผลลัพธ์เฉพาะทาง

สร้าง HTK จาก SHN lossless ที่บริสุทธิ์ — เสียงสะอาดสำหรับความต้องการแอปพลิเคชันเฉพาะ

ประมวลผลออนไลน์

ไม่ต้องติดตั้งเครื่องมือเฉพาะทาง — เซิร์ฟเวอร์จัดการแปลง SHN เป็น HTK ผ่านเบราว์เซอร์

ปลอดภัย

SHN ที่อัปโหลดจะถูกลบทันที ผลลัพธ์ HTK จะถูกลบจากเซิร์ฟเวอร์ภายใน 24 ชั่วโมง

วิธีแปลง SHN เป็น HTK

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ htk หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ htk ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

Shorten (SHN) เป็นโคเดกบีบอัดเสียงแบบไม่สูญเสียคุณภาพที่สร้างโดย Tony Robinson ที่ SoftSound และเผยแพร่ครั้งแรกในปี 1993 ทำให้เป็นหนึ่งในตัวบีบอัดแบบไม่สูญเสียคุณภาพในทางปฏิบัติที่เก่าแก่ที่สุด อัลกอริทึมใช้การทำนายเชิงเส้นเพื่อประมาณค่าตัวอย่างแต่ละตัวจากตัวก่อนหน้า จากนั้นเข้ารหัสค่าเศษเหลือด้วยรหัส Huffman หรือ Golomb-Rice อัตราส่วนการบีบอัดโดยทั่วไปอยู่ระหว่าง 2:1 ถึง 3:1 พร้อมการรับประกันว่าเอาต์พุตที่ถอดรหัสจะเหมือนกันทุกบิตกับต้นฉบับ Shorten มีความสำคัญทางวัฒนธรรมในช่วงปลายทศวรรษ 1990 ในฐานะรูปแบบที่นิยมสำหรับการแลกเปลี่ยนการบันทึกคอนเสิร์ตสดทางออนไลน์ — ชุมชนอย่าง etree.org สร้างเครือข่ายแจกจ่ายทั้งหมดรอบไฟล์ SHN และวงดนตรีอย่าง Grateful Dead และ Phish ให้การสนับสนุนโดยปริยาย ข้อดีประการหนึ่งคือความเรียบง่ายของรูปแบบ — การเข้ารหัสและถอดรหัสทำงานได้เร็วแม้บนฮาร์ดแวร์ระดับ Pentium ยุคแรก จุดแข็งอีกประการคือเอาต์พุตที่แน่นอน — อินพุตเดียวกันสร้างไบต์เหมือนกันเสมอ ทำให้ checksum เชื่อถือได้สำหรับการตรวจสอบความถูกต้อง แม้ว่า FLAC จะแทนที่ Shorten ด้วยการบีบอัดที่ดีกว่า การรองรับการค้นหาตำแหน่ง และเมทาดาทาแบบฝัง แต่ SHN ยังคงมีความสำคัญทางประวัติศาสตร์และคลังเพลงสดจำนวนมากในรูปแบบนี้ยังคงหมุนเวียนอยู่ในปัจจุบัน
ผู้พัฒนา: Tony Robinson / SoftSound
เผยแพร่ครั้งแรก: 1993
HTK เป็นคอนเทนเนอร์รูปคลื่นดั้งเดิมของ Hidden Markov Model Toolkit ชุดซอฟต์แวร์ที่พัฒนาที่ภาควิชาวิศวกรรมของมหาวิทยาลัยเคมบริดจ์สำหรับการวิจัยด้านการรู้จำเสียงพูด เผยแพร่ครั้งแรกในปี 1993 HTK กลายเป็นแพลตฟอร์มอ้างอิงในห้องปฏิบัติการภาษาศาสตร์คอมพิวเตอร์ทั่วโลกอย่างรวดเร็ว และรูปแบบไฟล์ก็ได้รับความนิยมตามไปด้วย แต่ละไฟล์เก็บลำดับเวกเตอร์พารามิเตอร์หรือตัวอย่างดิบนำหน้าด้วยส่วนหัว 12 ไบต์ที่ระบุจำนวนเฟรม คาบเฟรมในหน่วย 100 ns จำนวนไบต์ต่อเฟรม และรหัสประเภทที่ระบุชนิดข้อมูล — ตัวเลือกมีตั้งแต่ waveform PCM ไปจนถึง Mel-frequency cepstral coefficients และพลังงาน filter-bank ความอเนกประสงค์นี้ช่วยให้คอนเทนเนอร์เดียวบรรจุทั้งเสียงต้นทางและคุณลักษณะที่สกัดออกมาโดยไม่ต้องเปลี่ยนตัวแยกวิเคราะห์ ส่วนหัวที่เรียบง่ายอย่างจงใจหลีกเลี่ยง alignment padding หรือ optional chunks ทำให้อ่านรูปแบบจาก C, Python หรือ MATLAB ได้ง่ายด้วยโค้ดไบนารี I/O เพียงไม่กี่บรรทัด ข้อดีสามประการที่สนับสนุนความเกี่ยวข้องอย่างต่อเนื่องของ HTK: การผสานรวมอย่างแน่นแฟ้นกับไปป์ไลน์ฝึกอบรมและรู้จำของ HTK เลย์เอาต์ไบต์ที่แน่นอนซึ่งขจัดความคลุมเครือของตัวแยกวิเคราะห์ และการนำไปใช้อย่างแพร่หลายในคอร์ปัสทางวิชาการ
เผยแพร่ครั้งแรก: 1993

คำถามที่พบบ่อย

HTK คืออะไร?

HTK เป็นรูปแบบเสียงเฉพาะทาง — สำหรับ Hidden Markov Model Toolkit ในงานวิจัยการรู้จำเสียงพูด

ทำไมต้องแปลง SHN เป็น HTK?

แอปพลิเคชันเฉพาะทางต้องการ HTK โดย SHN lossless ให้วัตถุดิบเสียงที่สะอาดปราศจากสิ่งแปลกปลอม

อะไรจัดการ HTK ได้?

เครื่องมือเฉพาะทาง SoX และซอฟต์แวร์มืออาชีพที่เกี่ยวข้องรองรับการประมวลผลและเล่นเสียง HTK

คุณภาพถูกรักษาไว้ไหม?

เริ่มจาก SHN lossless ทำให้ไม่มีสิ่งแปลกปลอมจากการบีบอัดก่อนหน้า — คุณภาพผลลัพธ์ขึ้นกับความสามารถของ HTK

การแปลงปลอดภัยไหม?

SHN ที่อัปโหลดจะถูกลบทันทีหลังแปลง ผลลัพธ์ HTK จะถูกลบจากเซิร์ฟเวอร์ภายใน 24 ชั่วโมง