ตัวแปลง HCOM เป็น NIST

ย้ายเสียง HCOM เป็นฟอร์แมตเสียงวิจัย NIST

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

ฟอร์แมตระดับมาตรฐาน

แปลง HCOM เป็น NIST — ฟอร์แมตเสียงที่กำหนดโดย National Institute of Standards and Technology สำหรับการประเมินวิจัย

รองรับงานวิจัย

ฟอร์แมต NIST ทำงานร่วมกับเครื่องมือประเมินเสียงพูด เฟรมเวิร์กทดสอบมาตรฐาน และไปป์ไลน์ประมวลผลเสียงเชิงวิชาการ

ประมวลผลปลอดภัย

ไฟล์ HCOM ที่อัปโหลดจะถูกลบทันที ไฟล์ NIST จะถูกลบอัตโนมัติภายใน 24 ชั่วโมง

วิธีแปลง HCOM เป็น NIST

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ nist หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ nist ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

HCOM เป็นรูปแบบเสียงที่เข้ารหัสด้วย Huffman จากยุคแรกของ Macintosh ออกแบบมาเพื่อลดขนาดเสียงดิจิทัลสำหรับการแจกจ่ายบนฟล็อปปี้ดิสก์และระบบกระดานข่าวเมื่อพื้นที่จัดเก็บมีค่าและโมเด็มยังช้า ตัวเข้ารหัสรับอินพุต unsigned 8-bit PCM คำนวณตารางความถี่ของค่า sample-delta และสร้าง Huffman tree ที่เหมาะสมที่สุดซึ่งแทนที่ delta ที่พบบ่อยด้วยลำดับบิตสั้น อัตราส่วนการบีบอัด 2:1 หรือดีกว่าเป็นเรื่องปกติสำหรับการบันทึกเสียงพูด ซึ่งเป็นการประหยัดที่มีความหมายเมื่อฟล็อปปี้ 3.5 นิ้วจุเพียง 800 KB ไฟล์ถูกแจกจ่ายเป็น Macintosh resource forks และเล่นผ่านยูทิลิตี้อย่าง SoundApp และระบบนิเวศ BinHex ที่กำหนดการแลกเปลี่ยนซอฟต์แวร์ Mac ในช่วงปลายทศวรรษ 1980 รูปแบบรองรับอัตราสุ่มตัวอย่างสูงสุด 22.255 kHz ตรงกับความสามารถเอาต์พุตของฮาร์ดแวร์เสียง Macintosh ดั้งเดิม เครื่องมืออย่าง SoX ยังคงรองรับการถอดรหัส HCOM ทำให้การบันทึกที่เก็บไว้ยังเข้าถึงได้หลายทศวรรษต่อมา HCOM มีข้อดีสามประการในงานอนุรักษ์: การบีบอัดแบบไม่สูญเสียข้อมูลที่กู้คืนตัวอย่างดั้งเดิมได้อย่างแม่นยำ Huffman table ที่ฝังอยู่ในแต่ละไฟล์เพื่อการถอดรหัสโดยไม่ต้องพึ่งไฟล์ภายนอก และความแพร่หลายทางประวัติศาสตร์ในคลังเสียง Mac รุ่นเก่าหลายพันรายการ
ผู้พัฒนา: Apple Computer
เผยแพร่ครั้งแรก: 1985
NIST SPHERE (SPeech HEader REsources) เป็นรูปแบบไฟล์เสียงเฉพาะทางที่สร้างโดย สถาบันมาตรฐานและเทคโนโลยีแห่งชาติ สำหรับการวิจัยเสียงพูด โดยเฉพาะโปรเจกต์ที่ได้รับทุนจาก DARPA รูปแบบนี้ห่อหุ้มตัวอย่างเสียงดิบด้วยส่วนหัว ASCII ที่มีโครงสร้างซึ่งเข้ารหัสเมตาดาต้า เช่น อัตราสุ่มตัวอย่าง จำนวนแชนเนล ประเภทการเข้ารหัส ข้อมูลประชากรผู้พูด และคำอธิบายการถอดความ — เหมาะอย่างยิ่งสำหรับการเผยแพร่คอร์ปัสเสียงพูด ไฟล์ NIST มักเก็บ PCM แบบไม่บีบอัดหรือเสียง mu-law ที่อัตราสุ่มตัวอย่างคุณภาพโทรศัพท์ (8 kHz หรือ 16 kHz) แม้คอนเทนเนอร์จะยืดหยุ่นพอรองรับการเข้ารหัสหลายแบบ ข้อดีสำคัญคือส่วนหัวแบบบันทึกตัวเองที่หลากหลาย ช่วยให้นักวิจัยฝังเมตาดาต้าคอร์ปัสโดยละเอียดในไฟล์โดยตรง ไม่ต้องมีไฟล์ข้างเคียง SPHERE ยังกลายเป็นมาตรฐานที่ใช้จริงสำหรับฐานข้อมูลเสียงพูดหลัก ๆ เช่น TIMIT, Switchboard และคอร์ปัส Fisher รับประกันการรับรู้อย่างกว้างขวางในห้องปฏิบัติการทั้งด้านวิชาการและภาครัฐ ข้อกำหนดแบบเปิดและเครื่องมือบรรทัดคำสั่งที่มีให้ (sphere, h_strip, w_decode) ทำให้สามารถแปลง ตรวจสอบ และประมวลผลไฟล์เหล่านี้ทางโปรแกรมได้อย่างตรงไปตรงมาในไปป์ไลน์ประมวลผลเสียงพูด
เผยแพร่ครั้งแรก: 1990

คำถามที่พบบ่อย

ฟอร์แมต NIST คืออะไร?

NIST เป็นฟอร์แมตเสียงที่ใช้โดย National Institute of Standards and Technology สำหรับการประเมินเสียงพูด การวิจัย และการทดสอบมาตรฐาน

NIST ต่างจาก SPH อย่างไร?

NIST และ SPH (SPHERE) เป็นฟอร์แมตที่เกี่ยวข้องกันอย่างใกล้ชิด ทั้งคู่ใช้ NIST header พร้อมเสียง PCM โดยมีความแตกต่างเชิงโครงสร้างเล็กน้อย

ทำไมต้องแปลง HCOM เป็น NIST?

สำหรับงานประเมินเสียง การทดสอบมาตรฐานเสียงพูด หรือเวิร์กโฟลว์วิจัยที่ต้องการข้อมูลเสียงในฟอร์แมต NIST

ซอฟต์แวร์ใดอ่าน NIST?

SOX, เครื่องมือให้คะแนน NIST และเฟรมเวิร์กวิจัยรู้จำเสียงพูดเช่น HTK และ Kaldi รองรับไฟล์เสียง NIST

การแปลงเสร็จทันทีหรือไม่?

ไฟล์ HCOM มีขนาดกะทัดรัดมาก การแปลงเป็นฟอร์แมต NIST เสร็จภายในวินาทีบนระบบของเรา