ตัวแปลง CVS เป็น NIST

แปลงเสียง CVS เป็นรูปแบบ NIST ออนไลน์ — รวดเร็วและง่ายดาย

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

อัปเกรดรูปแบบ

CVS เป็นรูปแบบเฉพาะทางที่แทบไม่มีการรองรับ การแปลงเป็น NIST นำเสียงของคุณเข้าสู่รูปแบบที่ HTK toolkit และเครื่องมืออื่นๆ รู้จัก

แปลงเป็นชุด

อัปโหลดไฟล์บันทึกเสียง CVS หลายไฟล์พร้อมกันและแปลงเป็น NIST ทั้งหมดในครั้งเดียว — ไม่ต้องทำซ้ำทีละไฟล์

ใช้ได้ทุกอุปกรณ์

แปลง CVS เป็น NIST จากอุปกรณ์ใดก็ได้ — เดสก์ท็อป แล็ปท็อป แท็บเล็ต หรือโทรศัพท์ ต้องการเพียงเบราว์เซอร์และอินเทอร์เน็ต

วิธีแปลง CVS เป็น NIST

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ nist หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ nist ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

CVS เป็นการเข้ารหัสเสียงสำหรับโทรศัพท์ที่ใช้ Continuously Variable Slope Delta modulation แสดงเสียงพูดผ่านรูปแบบ delta 1 บิตที่ขนาดสเต็ปปรับตามแอมพลิจูดของสัญญาณเข้า พัฒนาภายใต้มาตรฐาน CCITT (ปัจจุบัน ITU-T) ในช่วงทศวรรษ 1970 CVS เข้ารหัสโดยเปรียบเทียบแต่ละตัวอย่างกับตัวอย่างก่อนหน้าและส่งออกบิตเดียว — ขึ้นหรือลง — โดยขนาดความชันปรับตามรูปแบบบิตล่าสุด ให้อัตราบิตที่ต่ำมาก โดยทั่วไป 16 kbps ที่อัตราสุ่มตัวอย่าง 8 kHz มีประสิทธิภาพสำหรับเสียงพูดแบนด์แคบบนช่องสัญญาณที่จำกัด ไฟล์ CVS เก็บข้อมูล delta แบบมีเครื่องหมายและมักประมวลผลด้วยเครื่องมืออย่าง SoX ข้อดีสำคัญคือความประหยัดแบนด์วิดท์: วิธีการ 1 บิตต่อตัวอย่างต้องการความจุในการส่งน้อยที่สุด จำเป็นสำหรับลิงก์วิทยุทางทหารและโครงสร้างพื้นฐานโทรศัพท์ดิจิทัลยุคแรก กลไกความชันแบบปรับตัวยังป้องกันความเพี้ยนจากการรับภาระเกินบนสัญญาณที่เปลี่ยนแปลงเร็ว ในขณะที่รักษาเสียงรบกวนแบบเม็ดให้อยู่ในระดับยอมรับได้ขณะช่วงเงียบ แม้ตัวแปลงสัญญาณแบนด์กว้างสมัยใหม่จะเข้ามาแทนที่ CVS แต่ยังคงมีความสำคัญทางประวัติศาสตร์และมีประโยชน์เฉพาะทางในอุปกรณ์โทรศัพท์และการสื่อสารแบบฝังตัวรุ่นเก่า
ผู้พัฒนา: CCITT / ITU-T
เผยแพร่ครั้งแรก: 1970
NIST SPHERE (SPeech HEader REsources) เป็นรูปแบบไฟล์เสียงเฉพาะทางที่สร้างโดย สถาบันมาตรฐานและเทคโนโลยีแห่งชาติ สำหรับการวิจัยเสียงพูด โดยเฉพาะโปรเจกต์ที่ได้รับทุนจาก DARPA รูปแบบนี้ห่อหุ้มตัวอย่างเสียงดิบด้วยส่วนหัว ASCII ที่มีโครงสร้างซึ่งเข้ารหัสเมตาดาต้า เช่น อัตราสุ่มตัวอย่าง จำนวนแชนเนล ประเภทการเข้ารหัส ข้อมูลประชากรผู้พูด และคำอธิบายการถอดความ — เหมาะอย่างยิ่งสำหรับการเผยแพร่คอร์ปัสเสียงพูด ไฟล์ NIST มักเก็บ PCM แบบไม่บีบอัดหรือเสียง mu-law ที่อัตราสุ่มตัวอย่างคุณภาพโทรศัพท์ (8 kHz หรือ 16 kHz) แม้คอนเทนเนอร์จะยืดหยุ่นพอรองรับการเข้ารหัสหลายแบบ ข้อดีสำคัญคือส่วนหัวแบบบันทึกตัวเองที่หลากหลาย ช่วยให้นักวิจัยฝังเมตาดาต้าคอร์ปัสโดยละเอียดในไฟล์โดยตรง ไม่ต้องมีไฟล์ข้างเคียง SPHERE ยังกลายเป็นมาตรฐานที่ใช้จริงสำหรับฐานข้อมูลเสียงพูดหลัก ๆ เช่น TIMIT, Switchboard และคอร์ปัส Fisher รับประกันการรับรู้อย่างกว้างขวางในห้องปฏิบัติการทั้งด้านวิชาการและภาครัฐ ข้อกำหนดแบบเปิดและเครื่องมือบรรทัดคำสั่งที่มีให้ (sphere, h_strip, w_decode) ทำให้สามารถแปลง ตรวจสอบ และประมวลผลไฟล์เหล่านี้ทางโปรแกรมได้อย่างตรงไปตรงมาในไปป์ไลน์ประมวลผลเสียงพูด
เผยแพร่ครั้งแรก: 1990

คำถามที่พบบ่อย

ทำไม NIST ถึงเป็นตัวเลือกที่ดีกว่า CVS?

CVS เป็นรูปแบบที่มีการรองรับอุปกรณ์จำกัดและตัวเข้ารหัสที่ล้าสมัย การแปลงเป็น NIST จะให้มาตรฐานฐานข้อมูลเสียงพูดที่ใช้งานได้กว้างขึ้น

ใช้โปรแกรมอะไรเปิดไฟล์ NIST ได้บ้าง?

เปิดไฟล์ NIST ได้ด้วย HTK toolkit, SoX และซอฟต์แวร์วิจัยเสียงพูด

การแปลง CVS เป็น NIST มีผลต่อคุณภาพเสียงหรือไม่?

NIST รักษาข้อมูลเสียงได้อย่างซื่อสัตย์ เนื่องจาก CVS มีความละเอียดจำกัดอยู่แล้ว ผลลัพธ์ NIST จึงตรงกับคุณภาพต้นฉบับ

แปลงจากมือถือได้ไหม?

ได้ ตัวแปลงออนไลน์ทำงานได้ทุกแพลตฟอร์ม — ใช้ได้จากคอมพิวเตอร์ แท็บเล็ต หรือสมาร์ทโฟนที่มีเว็บเบราว์เซอร์

การแปลง CVS เป็น NIST มีข้อจำกัดไหม?

การแปลงมาตรฐานทำงานได้โดยไม่มีข้อจำกัดสำหรับการใช้งานทั่วไป แผนพรีเมียมให้ความเร็วและความจุเพิ่มเติมสำหรับงานปริมาณมาก

ต้องลงทะเบียนก่อนแปลงไหม?

ไม่จำเป็นต้องมีบัญชีสำหรับการแปลงมาตรฐาน เพียงอัปโหลดไฟล์ CVS เลือก NIST แล้วดาวน์โหลดผลลัพธ์