ตัวแปลง SHN เป็น HTK

เข้ารหัสเสียง Shorten เป็น HTK สำหรับวิจัยเสียงพูดออนไลน์

เลือกไฟล์ต่างๆ

วางไฟล์ต่างๆ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ

ไปยัง

ผลลัพธ์เฉพาะทาง

สร้าง HTK จาก SHN lossless ที่บริสุทธิ์ — เสียงสะอาดสำหรับความต้องการแอปพลิเคชันเฉพาะ

ประมวลผลออนไลน์

ไม่ต้องติดตั้งเครื่องมือเฉพาะทาง — เซิร์ฟเวอร์จัดการแปลง SHN เป็น HTK ผ่านเบราว์เซอร์

ปลอดภัย

SHN ที่อัปโหลดจะถูกลบทันที ผลลัพธ์ HTK จะถูกลบจากเซิร์ฟเวอร์ภายใน 24 ชั่วโมง

วิธีแปลง SHN เป็น HTK

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

เลือกรูปแบบไฟล์ htk หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ htk ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

Shorten (SHN) เป็นโคเดกบีบอัดเสียงแบบไม่สูญเสียคุณภาพที่สร้างโดย Tony Robinson ที่ SoftSound และเผยแพร่ครั้งแรกในปี 1993 ทำให้เป็นหนึ่งในตัวบีบอัดแบบไม่สูญเสียคุณภาพในทางปฏิบัติที่เก่าแก่ที่สุด อัลกอริทึมใช้การทำนายเชิงเส้นเพื่อประมาณค่าตัวอย่างแต่ละตัวจากตัวก่อนหน้า จากนั้นเข้ารหัสค่าเศษเหลือด้วยรหัส Huffman หรือ Golomb-Rice อัตราส่วนการบีบอัดโดยทั่วไปอยู่ระหว่าง 2:1 ถึง 3:1 พร้อมการรับประกันว่าเอาต์พุตที่ถอดรหัสจะเหมือนกันทุกบิตกับต้นฉบับ Shorten มีความสำคัญทางวัฒนธรรมในช่วงปลายทศวรรษ 1990 ในฐานะรูปแบบที่นิยมสำหรับการแลกเปลี่ยนการบันทึกคอนเสิร์ตสดทางออนไลน์ — ชุมชนอย่าง etree.org สร้างเครือข่ายแจกจ่ายทั้งหมดรอบไฟล์ SHN และวงดนตรีอย่าง Grateful Dead และ Phish ให้การสนับสนุนโดยปริยาย ข้อดีประการหนึ่งคือความเรียบง่ายของรูปแบบ — การเข้ารหัสและถอดรหัสทำงานได้เร็วแม้บนฮาร์ดแวร์ระดับ Pentium ยุคแรก จุดแข็งอีกประการคือเอาต์พุตที่แน่นอน — อินพุตเดียวกันสร้างไบต์เหมือนกันเสมอ ทำให้ checksum เชื่อถือได้สำหรับการตรวจสอบความถูกต้อง แม้ว่า FLAC จะแทนที่ Shorten ด้วยการบีบอัดที่ดีกว่า การรองรับการค้นหาตำแหน่ง และเมทาดาทาแบบฝัง แต่ SHN ยังคงมีความสำคัญทางประวัติศาสตร์และคลังเพลงสดจำนวนมากในรูปแบบนี้ยังคงหมุนเวียนอยู่ในปัจจุบัน

ผู้พัฒนา: Tony Robinson / SoftSound

เผยแพร่ครั้งแรก: 1993

HTK เป็นคอนเทนเนอร์รูปคลื่นดั้งเดิมของ Hidden Markov Model Toolkit ชุดซอฟต์แวร์ที่พัฒนาที่ภาควิชาวิศวกรรมของมหาวิทยาลัยเคมบริดจ์สำหรับการวิจัยด้านการรู้จำเสียงพูด เผยแพร่ครั้งแรกในปี 1993 HTK กลายเป็นแพลตฟอร์มอ้างอิงในห้องปฏิบัติการภาษาศาสตร์คอมพิวเตอร์ทั่วโลกอย่างรวดเร็ว และรูปแบบไฟล์ก็ได้รับความนิยมตามไปด้วย แต่ละไฟล์เก็บลำดับเวกเตอร์พารามิเตอร์หรือตัวอย่างดิบนำหน้าด้วยส่วนหัว 12 ไบต์ที่ระบุจำนวนเฟรม คาบเฟรมในหน่วย 100 ns จำนวนไบต์ต่อเฟรม และรหัสประเภทที่ระบุชนิดข้อมูล — ตัวเลือกมีตั้งแต่ waveform PCM ไปจนถึง Mel-frequency cepstral coefficients และพลังงาน filter-bank ความอเนกประสงค์นี้ช่วยให้คอนเทนเนอร์เดียวบรรจุทั้งเสียงต้นทางและคุณลักษณะที่สกัดออกมาโดยไม่ต้องเปลี่ยนตัวแยกวิเคราะห์ ส่วนหัวที่เรียบง่ายอย่างจงใจหลีกเลี่ยง alignment padding หรือ optional chunks ทำให้อ่านรูปแบบจาก C, Python หรือ MATLAB ได้ง่ายด้วยโค้ดไบนารี I/O เพียงไม่กี่บรรทัด ข้อดีสามประการที่สนับสนุนความเกี่ยวข้องอย่างต่อเนื่องของ HTK: การผสานรวมอย่างแน่นแฟ้นกับไปป์ไลน์ฝึกอบรมและรู้จำของ HTK เลย์เอาต์ไบต์ที่แน่นอนซึ่งขจัดความคลุมเครือของตัวแยกวิเคราะห์ และการนำไปใช้อย่างแพร่หลายในคอร์ปัสทางวิชาการ

ผู้พัฒนา: Cambridge University Engineering Department

เผยแพร่ครั้งแรก: 1993

คำถามที่พบบ่อย

HTK คืออะไร?

HTK เป็นรูปแบบเสียงเฉพาะทาง — สำหรับ Hidden Markov Model Toolkit ในงานวิจัยการรู้จำเสียงพูด

ทำไมต้องแปลง SHN เป็น HTK?

แอปพลิเคชันเฉพาะทางต้องการ HTK โดย SHN lossless ให้วัตถุดิบเสียงที่สะอาดปราศจากสิ่งแปลกปลอม

อะไรจัดการ HTK ได้?

เครื่องมือเฉพาะทาง SoX และซอฟต์แวร์มืออาชีพที่เกี่ยวข้องรองรับการประมวลผลและเล่นเสียง HTK

คุณภาพถูกรักษาไว้ไหม?

เริ่มจาก SHN lossless ทำให้ไม่มีสิ่งแปลกปลอมจากการบีบอัดก่อนหน้า — คุณภาพผลลัพธ์ขึ้นกับความสามารถของ HTK

การแปลงปลอดภัยไหม?

SHN ที่อัปโหลดจะถูกลบทันทีหลังแปลง ผลลัพธ์ HTK จะถูกลบจากเซิร์ฟเวอร์ภายใน 24 ชั่วโมง

การแปลงที่เกี่ยวข้อง

SHN เป็น MP3

SHN เป็น FLAC

SHN เป็น WAV

SHN เป็น AIFF

SHN เป็น M4A

SHN เป็น WV

SHN เป็น AAC

SHN เป็น WMA

SHN เป็น OGG

SHN เป็น AC3

SHN เป็น AMR

SHN เป็น M4R

SHN เป็น DTS

SHN เป็น OPUS

SHN เป็น SPX

SHN เป็น CAF

SHN เป็น W64

SHN เป็น VOC

SHN เป็น TTA

SHN เป็น RA

SHN เป็น MP2

SHN เป็น OGA

SHN เป็น PVF

SHN เป็น PRC

SHN เป็น MAUD

SHN เป็น 8SVX

SHN เป็น AMB

SHN เป็น AU

SHN เป็น SND

SHN เป็น SNDR

SHN เป็น SNDT

SHN เป็น AVR

SHN เป็น CDDA

SHN เป็น CVS

SHN เป็น CVSD

SHN เป็น CVU

SHN เป็น DVMS

SHN เป็น VMS

SHN เป็น FAP

SHN เป็น PAF

SHN เป็น FSSD

SHN เป็น SOU

SHN เป็น GSRT

SHN เป็น GSM

SHN เป็น HCOM

SHN เป็น HTK

SHN เป็น IMA

SHN เป็น IRCAM

SHN เป็น SLN

SHN เป็น SPH

SHN เป็น NIST

SHN เป็น SMP

SHN เป็น TXW

SHN เป็น VOX

SHN เป็น WVE

SHN เป็น SD2

ตัวแปลงเฉพาะ

MP3 เป็น HTK

WAV เป็น HTK

MP4 เป็น HTK

FLAC เป็น HTK

M4A เป็น HTK

OGG เป็น HTK

MPG เป็น HTK

ASF เป็น HTK

AAC เป็น HTK

3G2 เป็น HTK

3GP เป็น HTK

AAF เป็น HTK

AV1 เป็น HTK

AVCHD เป็น HTK

AVI เป็น HTK

CAVS เป็น HTK

DIVX เป็น HTK

DV เป็น HTK

F4V เป็น HTK

FLV เป็น HTK

HEVC เป็น HTK

M2TS เป็น HTK

M2V เป็น HTK

M4V เป็น HTK

MJPEG เป็น HTK

MKV เป็น HTK

MOD เป็น HTK

MOV เป็น HTK

MPEG เป็น HTK

MPEG-2 เป็น HTK