ตัวแปลง SHN เป็น NIST

เข้ารหัสเสียง Shorten เป็น NIST สำหรับการประเมินออนไลน์

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

ผลลัพธ์เฉพาะทาง

สร้าง NIST จาก SHN lossless — เสียงสะอาดสำหรับงานวิจัยการรู้จำเสียงพูด

ประมวลผลออนไลน์

ไม่ต้องติดตั้งเครื่องมือเฉพาะทาง — เซิร์ฟเวอร์จัดการแปลง SHN เป็น NIST ผ่านเบราว์เซอร์

ปลอดภัย

SHN ที่อัปโหลดจะถูกลบทันที ผลลัพธ์ NIST จะถูกลบจากเซิร์ฟเวอร์ภายใน 24 ชั่วโมง

วิธีแปลง SHN เป็น NIST

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ nist หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ nist ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

Shorten (SHN) เป็นโคเดกบีบอัดเสียงแบบไม่สูญเสียคุณภาพที่สร้างโดย Tony Robinson ที่ SoftSound และเผยแพร่ครั้งแรกในปี 1993 ทำให้เป็นหนึ่งในตัวบีบอัดแบบไม่สูญเสียคุณภาพในทางปฏิบัติที่เก่าแก่ที่สุด อัลกอริทึมใช้การทำนายเชิงเส้นเพื่อประมาณค่าตัวอย่างแต่ละตัวจากตัวก่อนหน้า จากนั้นเข้ารหัสค่าเศษเหลือด้วยรหัส Huffman หรือ Golomb-Rice อัตราส่วนการบีบอัดโดยทั่วไปอยู่ระหว่าง 2:1 ถึง 3:1 พร้อมการรับประกันว่าเอาต์พุตที่ถอดรหัสจะเหมือนกันทุกบิตกับต้นฉบับ Shorten มีความสำคัญทางวัฒนธรรมในช่วงปลายทศวรรษ 1990 ในฐานะรูปแบบที่นิยมสำหรับการแลกเปลี่ยนการบันทึกคอนเสิร์ตสดทางออนไลน์ — ชุมชนอย่าง etree.org สร้างเครือข่ายแจกจ่ายทั้งหมดรอบไฟล์ SHN และวงดนตรีอย่าง Grateful Dead และ Phish ให้การสนับสนุนโดยปริยาย ข้อดีประการหนึ่งคือความเรียบง่ายของรูปแบบ — การเข้ารหัสและถอดรหัสทำงานได้เร็วแม้บนฮาร์ดแวร์ระดับ Pentium ยุคแรก จุดแข็งอีกประการคือเอาต์พุตที่แน่นอน — อินพุตเดียวกันสร้างไบต์เหมือนกันเสมอ ทำให้ checksum เชื่อถือได้สำหรับการตรวจสอบความถูกต้อง แม้ว่า FLAC จะแทนที่ Shorten ด้วยการบีบอัดที่ดีกว่า การรองรับการค้นหาตำแหน่ง และเมทาดาทาแบบฝัง แต่ SHN ยังคงมีความสำคัญทางประวัติศาสตร์และคลังเพลงสดจำนวนมากในรูปแบบนี้ยังคงหมุนเวียนอยู่ในปัจจุบัน
ผู้พัฒนา: Tony Robinson / SoftSound
เผยแพร่ครั้งแรก: 1993
NIST SPHERE (SPeech HEader REsources) เป็นรูปแบบไฟล์เสียงเฉพาะทางที่สร้างโดย สถาบันมาตรฐานและเทคโนโลยีแห่งชาติ สำหรับการวิจัยเสียงพูด โดยเฉพาะโปรเจกต์ที่ได้รับทุนจาก DARPA รูปแบบนี้ห่อหุ้มตัวอย่างเสียงดิบด้วยส่วนหัว ASCII ที่มีโครงสร้างซึ่งเข้ารหัสเมตาดาต้า เช่น อัตราสุ่มตัวอย่าง จำนวนแชนเนล ประเภทการเข้ารหัส ข้อมูลประชากรผู้พูด และคำอธิบายการถอดความ — เหมาะอย่างยิ่งสำหรับการเผยแพร่คอร์ปัสเสียงพูด ไฟล์ NIST มักเก็บ PCM แบบไม่บีบอัดหรือเสียง mu-law ที่อัตราสุ่มตัวอย่างคุณภาพโทรศัพท์ (8 kHz หรือ 16 kHz) แม้คอนเทนเนอร์จะยืดหยุ่นพอรองรับการเข้ารหัสหลายแบบ ข้อดีสำคัญคือส่วนหัวแบบบันทึกตัวเองที่หลากหลาย ช่วยให้นักวิจัยฝังเมตาดาต้าคอร์ปัสโดยละเอียดในไฟล์โดยตรง ไม่ต้องมีไฟล์ข้างเคียง SPHERE ยังกลายเป็นมาตรฐานที่ใช้จริงสำหรับฐานข้อมูลเสียงพูดหลัก ๆ เช่น TIMIT, Switchboard และคอร์ปัส Fisher รับประกันการรับรู้อย่างกว้างขวางในห้องปฏิบัติการทั้งด้านวิชาการและภาครัฐ ข้อกำหนดแบบเปิดและเครื่องมือบรรทัดคำสั่งที่มีให้ (sphere, h_strip, w_decode) ทำให้สามารถแปลง ตรวจสอบ และประมวลผลไฟล์เหล่านี้ทางโปรแกรมได้อย่างตรงไปตรงมาในไปป์ไลน์ประมวลผลเสียงพูด
เผยแพร่ครั้งแรก: 1990

คำถามที่พบบ่อย

NIST คืออะไร?

NIST เป็นรูปแบบเสียงเฉพาะทาง — สเปคจาก NIST สำหรับชุดข้อมูลประเมินการรู้จำเสียงพูด

ทำไมต้องแปลง SHN เป็น NIST?

แอปพลิเคชันเฉพาะต้องการ NIST โดย SHN lossless ให้วัตถุดิบเสียงที่สะอาดปราศจากสิ่งแปลกปลอม

อะไรจัดการ NIST ได้?

เครื่องมือเฉพาะทาง SoX และซอฟต์แวร์มืออาชีพที่เกี่ยวข้องรองรับการประมวลผลเสียง NIST

คุณภาพถูกรักษาไว้ไหม?

เริ่มจาก SHN lossless ไม่มีสิ่งแปลกปลอมจากการบีบอัดก่อนหน้า — คุณภาพผลลัพธ์ขึ้นกับรูปแบบ NIST

การแปลงปลอดภัยไหม?

SHN ที่อัปโหลดจะถูกลบทันทีหลังแปลง ผลลัพธ์ NIST จะถูกลบจากเซิร์ฟเวอร์ภายใน 24 ชั่วโมง