ตัวแปลง NIST เป็น SPH

แปลง NIST เป็น SPH ออนไลน์อย่างราบรื่น

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

แปลงบนคลาวด์

การประมวลผลบนเซิร์ฟเวอร์ทำให้การแปลง NIST เป็น SPH ไม่สร้างภาระให้อุปกรณ์ ทุกอย่างทำงานบนคลาวด์อย่างราบรื่น

ใช้ได้ทุกแพลตฟอร์ม

การแปลง NIST เป็น SPH ทำงานได้ทุกแพลตฟอร์ม เปิดเบราว์เซอร์ อัปโหลด แล้วแปลง — ไม่ว่าจะใช้ระบบปฏิบัติการอะไร

เอาต์พุตแม่นยำ

คาดหวังผลลัพธ์ NIST เป็น SPH ที่ถูกต้อง ทั้งสองรูปแบบออกแบบมาเพื่อเสียง จึงมั่นใจในการถ่ายโอนข้อมูลที่สะอาด

วิธีแปลง NIST เป็น SPH

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ sph หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ sph ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

NIST SPHERE (SPeech HEader REsources) เป็นรูปแบบไฟล์เสียงเฉพาะทางที่สร้างโดย สถาบันมาตรฐานและเทคโนโลยีแห่งชาติ สำหรับการวิจัยเสียงพูด โดยเฉพาะโปรเจกต์ที่ได้รับทุนจาก DARPA รูปแบบนี้ห่อหุ้มตัวอย่างเสียงดิบด้วยส่วนหัว ASCII ที่มีโครงสร้างซึ่งเข้ารหัสเมตาดาต้า เช่น อัตราสุ่มตัวอย่าง จำนวนแชนเนล ประเภทการเข้ารหัส ข้อมูลประชากรผู้พูด และคำอธิบายการถอดความ — เหมาะอย่างยิ่งสำหรับการเผยแพร่คอร์ปัสเสียงพูด ไฟล์ NIST มักเก็บ PCM แบบไม่บีบอัดหรือเสียง mu-law ที่อัตราสุ่มตัวอย่างคุณภาพโทรศัพท์ (8 kHz หรือ 16 kHz) แม้คอนเทนเนอร์จะยืดหยุ่นพอรองรับการเข้ารหัสหลายแบบ ข้อดีสำคัญคือส่วนหัวแบบบันทึกตัวเองที่หลากหลาย ช่วยให้นักวิจัยฝังเมตาดาต้าคอร์ปัสโดยละเอียดในไฟล์โดยตรง ไม่ต้องมีไฟล์ข้างเคียง SPHERE ยังกลายเป็นมาตรฐานที่ใช้จริงสำหรับฐานข้อมูลเสียงพูดหลัก ๆ เช่น TIMIT, Switchboard และคอร์ปัส Fisher รับประกันการรับรู้อย่างกว้างขวางในห้องปฏิบัติการทั้งด้านวิชาการและภาครัฐ ข้อกำหนดแบบเปิดและเครื่องมือบรรทัดคำสั่งที่มีให้ (sphere, h_strip, w_decode) ทำให้สามารถแปลง ตรวจสอบ และประมวลผลไฟล์เหล่านี้ทางโปรแกรมได้อย่างตรงไปตรงมาในไปป์ไลน์ประมวลผลเสียงพูด
เผยแพร่ครั้งแรก: 1990
SPH เป็นนามสกุลไฟล์สำหรับเสียงที่จัดเก็บในรูปแบบ NIST SPHERE (SPeech HEader REsources) มาตรฐานที่สร้างโดยสถาบันมาตรฐานและเทคโนโลยีแห่งชาติสหรัฐอเมริการาวปี 1990 สร้างขึ้นสำหรับการวิจัยด้านเสียงพูด ไฟล์ SPH มีส่วนหัว ASCII ขนาด 1024 ไบต์ที่บรรจุเมทาดาทา — ตัวระบุฐานข้อมูล จำนวนช่องสัญญาณ อัตราสุ่มตัวอย่าง ลำดับไบต์ และประเภทการบีบอัด — ทำให้ทุกการบันทึกอธิบายตัวเองได้ เสียงพื้นฐานโดยทั่วไปเป็น PCM เชิงเส้น 16 บิตที่สุ่มตัวอย่าง 16 kHz แม้ว่าจะอนุญาตให้ใช้การกำหนดค่าอื่นได้ นักวิจัยที่ NIST, DARPA และมหาวิทยาลัยทั่วโลกพึ่งพา SPH สำหรับการเผยแพร่คลังเสียงพูดเช่น TIMIT, Switchboard และคอลเลกชัน LDC ที่เป็นรากฐานของระบบการรู้จำเสียงพูดอัตโนมัติสมัยใหม่ ข้อดีสำคัญคือส่วนหัวที่อ่านได้ด้วยมนุษย์ ทำให้สคริปต์สามารถแยกวิเคราะห์เมทาดาทาการบันทึกได้โดยไม่ต้องถอดรหัสไบนารี การกำหนดมาตรฐานที่เข้มงวดของรูปแบบยังขจัดความกำกวมเมื่อแชร์ชุดข้อมูลข้ามสถาบันและแพลตฟอร์ม เนื่องจากไฟล์ SPH จัดเก็บ PCM แบบไม่บีบอัด จึงรักษาความเที่ยงตรงของเสียงอย่างเต็มที่ — สิ่งสำคัญอย่างยิ่งเมื่อฝึกแบบจำลองอะคูสติกที่แม้แต่สิ่งแปลกปลอมเล็กน้อยก็อาจบิดเบือนผลลัพธ์ได้
เผยแพร่ครั้งแรก: 1990

คำถามที่พบบ่อย

ทำไมต้องแปลง NIST เป็น SPH?

NIST และ SPH ต่างใช้การเข้ารหัส SPHERE แต่อาจต่างกันในเวอร์ชันเฮดเดอร์ การเข้ารหัสใหม่ช่วยให้เข้ากันได้อย่างสมบูรณ์กับเครื่องมือ SPH ของคุณ

เปิดไฟล์ SPH ด้วยโปรแกรมอะไรได้บ้าง?

เปิด SPH ได้ด้วย SoX, เครื่องมือเสียงพูด NIST/SPHERE หรือแอปพลิเคชันวิจัยภาษาศาสตร์

การแปลง NIST เป็น SPH จะมีผลต่อคุณภาพเสียงไหม?

เป้าหมาย lossless จะเก็บข้อมูลต้นฉบับทั้งหมดไว้ รูปแบบ lossy แลกคุณภาพเสียงเล็กน้อยเพื่อขนาดไฟล์ที่เล็กลงอย่างมาก

แปลงไฟล์ NIST หลายไฟล์เป็น SPH พร้อมกันได้ไหม?

ได้แน่นอน วางไฟล์บันทึกเสียง NIST หลายไฟล์ลงในตัวแปลงแล้วประมวลผลทั้งหมดเป็น SPH ในการดำเนินการเดียว

การแปลง NIST เป็น SPH ปลอดภัยและเป็นส่วนตัวไหม?

ใช่ — ไฟล์บันทึกเสียง NIST ที่อัปโหลดจะถูกลบทันทีหลังประมวลผล เอาต์พุต SPH ที่แปลงแล้วจะถูกลบภายใน 24 ชั่วโมง

ต้องติดตั้งซอฟต์แวร์พิเศษไหม?

ไม่ต้องเลย การแปลงทำออนไลน์ — เพียงเปิดเบราว์เซอร์ อัปโหลดไฟล์ NIST แล้วดาวน์โหลดผลลัพธ์ SPH