ตัวแปลง NIST เป็น VOX

แปลง NIST เป็น VOX ออนไลน์อย่างรวดเร็ว

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

รักษาคุณภาพ

คุณภาพเสียงจาก NIST เป็น VOX ถูกดูแลอย่างพิถีพิถัน ตัวแปลงเคารพอัตราสุ่มตัวอย่างและความลึกบิตเพื่อผลลัพธ์ที่แม่นยำ

เครื่องจักรออนไลน์

โครงสร้างพื้นฐานคลาวด์จัดการการแปลง NIST เป็น VOX ไม่ใช้ทรัพยากรเครื่อง — อุปกรณ์ของคุณทำงานเต็มประสิทธิภาพ

เข้าถึงได้ทุกที่

ไม่มีข้อจำกัดด้านแพลตฟอร์ม — แปลง NIST เป็น VOX บนอุปกรณ์ใดก็ได้ที่มีเบราว์เซอร์ เดสก์ท็อปและมือถือรองรับเท่าเทียมกัน

วิธีแปลง NIST เป็น VOX

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ vox หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ vox ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

NIST SPHERE (SPeech HEader REsources) เป็นรูปแบบไฟล์เสียงเฉพาะทางที่สร้างโดย สถาบันมาตรฐานและเทคโนโลยีแห่งชาติ สำหรับการวิจัยเสียงพูด โดยเฉพาะโปรเจกต์ที่ได้รับทุนจาก DARPA รูปแบบนี้ห่อหุ้มตัวอย่างเสียงดิบด้วยส่วนหัว ASCII ที่มีโครงสร้างซึ่งเข้ารหัสเมตาดาต้า เช่น อัตราสุ่มตัวอย่าง จำนวนแชนเนล ประเภทการเข้ารหัส ข้อมูลประชากรผู้พูด และคำอธิบายการถอดความ — เหมาะอย่างยิ่งสำหรับการเผยแพร่คอร์ปัสเสียงพูด ไฟล์ NIST มักเก็บ PCM แบบไม่บีบอัดหรือเสียง mu-law ที่อัตราสุ่มตัวอย่างคุณภาพโทรศัพท์ (8 kHz หรือ 16 kHz) แม้คอนเทนเนอร์จะยืดหยุ่นพอรองรับการเข้ารหัสหลายแบบ ข้อดีสำคัญคือส่วนหัวแบบบันทึกตัวเองที่หลากหลาย ช่วยให้นักวิจัยฝังเมตาดาต้าคอร์ปัสโดยละเอียดในไฟล์โดยตรง ไม่ต้องมีไฟล์ข้างเคียง SPHERE ยังกลายเป็นมาตรฐานที่ใช้จริงสำหรับฐานข้อมูลเสียงพูดหลัก ๆ เช่น TIMIT, Switchboard และคอร์ปัส Fisher รับประกันการรับรู้อย่างกว้างขวางในห้องปฏิบัติการทั้งด้านวิชาการและภาครัฐ ข้อกำหนดแบบเปิดและเครื่องมือบรรทัดคำสั่งที่มีให้ (sphere, h_strip, w_decode) ทำให้สามารถแปลง ตรวจสอบ และประมวลผลไฟล์เหล่านี้ทางโปรแกรมได้อย่างตรงไปตรงมาในไปป์ไลน์ประมวลผลเสียงพูด
เผยแพร่ครั้งแรก: 1990
VOX เป็นรูปแบบเสียงแบบไม่มีส่วนหัวที่สร้างขึ้นรอบการเข้ารหัส Dialogic ADPCM ถูกนำมาใช้อย่างแพร่หลายในระบบโทรศัพท์ ระบบตอบรับด้วยเสียงอัตโนมัติ (IVR) และแพลตฟอร์มวอยซ์เมลตั้งแต่ทศวรรษ 1980 ตัวอย่างเสียงแต่ละตัวถูกบีบอัดเป็น 4 บิตโดยใช้อัลกอริทึมที่พัฒนาโดย Oki Electric และนำไปใช้ในฮาร์ดแวร์บนการ์ดอินเทอร์เฟซโทรศัพท์ของ Dialogic Corporation ไฟล์ VOX โดยทั่วไปใช้อัตราสุ่มตัวอย่าง 6000 หรือ 8000 Hz สร้างการบันทึกที่กระทัดรัดมากซึ่งปรับแต่งสำหรับความชัดเจนของเสียงพูดมากกว่าความเที่ยงตรงทางดนตรี เนื่องจากรูปแบบไม่มีส่วนหัว ซอฟต์แวร์เล่นต้องทราบอัตราสุ่มตัวอย่างและพารามิเตอร์การเข้ารหัสล่วงหน้า — ข้อแลกเปลี่ยนที่ลดโอเวอร์เฮดแต่ต้องการการจัดการไฟล์อย่างระมัดระวัง ข้อดีหลักของ VOX คือประสิทธิภาพในการจัดเก็บ — การบันทึกเสียงหนึ่งนาทีที่ 8 kHz ใช้พื้นที่ประมาณ 240 KB ทำให้เหมาะสมสำหรับระบบที่จัดเก็บพรอมต์หลายพันรายการ Dialogic ADPCM สอดคล้องกับมาตรฐาน ITU-T G.726 รับประกันความเข้ากันได้ข้ามอุปกรณ์โทรศัพท์จากผู้ผลิตต่างๆ แม้ว่าศูนย์บริการลูกค้าสมัยใหม่จะย้ายไปสู่ระบบ IP พร้อมโคเดกอย่าง Opus แต่ไลบรารี VOX จำนวนมากยังคงมีอยู่ในระบบ IVR เดิมและคลังเก็บถาวรเพื่อการปฏิบัติตามกฎระเบียบทั่วโลก
ผู้พัฒนา: Dialogic Corporation
เผยแพร่ครั้งแรก: 1983

คำถามที่พบบ่อย

ทำไมต้องแปลง NIST เป็น VOX?

ไฟล์ NIST มีขนาดใหญ่เกินไปสำหรับระบบ IVR ของโทรศัพท์ VOX ใช้ Dialogic ADPCM เพื่อให้อัตราการบีบอัดสูงสำหรับ voice prompt

เปิดไฟล์ VOX ด้วยโปรแกรมอะไรได้บ้าง?

เปิด VOX ได้ด้วย SoX, ระบบโทรศัพท์ Dialogic หรือ Goldwave สำหรับเสียง Dialogic ADPCM

ต้องติดตั้งซอฟต์แวร์พิเศษไหม?

ไม่ต้องติดตั้งซอฟต์แวร์ใด ๆ ตัวแปลง NIST เป็น VOX ทำงานผ่านเว็บเบราว์เซอร์บนระบบปฏิบัติการใดก็ได้

การแปลง NIST เป็น VOX ใช้เวลานานไหม?

ไฟล์ NIST ส่วนใหญ่แปลงเป็น VOX ภายในไม่กี่วินาที ไฟล์บันทึกเสียงขนาดใหญ่อาจใช้เวลาเพิ่มเล็กน้อย แต่ผลลัพธ์มาถึงอย่างรวดเร็ว

รองรับแพลตฟอร์มอะไรบ้างสำหรับแปลง NIST เป็น VOX?

อุปกรณ์ใดก็ได้ที่มีเว็บเบราว์เซอร์ — Windows, macOS, Linux, Android, iOS ตัวแปลงไม่ต้องติดตั้งซอฟต์แวร์ใด ๆ

ปรับตั้งค่าเสียงก่อนแปลงได้ไหม?

พารามิเตอร์เสียง เช่น อัตราสุ่มตัวอย่าง ช่องสัญญาณ และคุณภาพการเข้ารหัส สามารถปรับได้ก่อนแปลงไฟล์ NIST เป็น VOX