ตัวแปลง CVSD เป็น SPH

เปลี่ยนเสียง CVSD เป็น SPH — ไม่ต้องติดตั้งซอฟต์แวร์

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

เอนจินคลาวด์เร็ว

การแปลงทำงานบนเซิร์ฟเวอร์ของเรา ไม่ใช่อุปกรณ์ของคุณ — เสียง CVSD ขนาดใหญ่แปลงเป็น SPH ได้โดยไม่ทำให้เครื่องช้า

แปลงรวดเร็ว

การแปลง CVSD เป็น SPH ส่วนใหญ่เสร็จภายในไม่กี่วินาที เอนจินคลาวด์ประมวลผลเสียงอย่างรวดเร็วไม่ว่าจะยาวเท่าใด

ขยายการเข้าถึง

CVSD เป็นฟอร์แมตเก่าเฉพาะทางที่รองรับน้อยมาก การแปลงเป็น SPH นำเสียงเข้าสู่ฟอร์แมตที่ HTK toolkit และเครื่องมืออื่นๆ รู้จัก

วิธีแปลง CVSD เป็น SPH

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ sph หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ sph ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

CVSD (Continuously Variable Slope Delta modulation) เป็นวิธีแปลงเสียงพูดเป็นดิจิทัลที่ได้รับมาตรฐานสำหรับการใช้งานทางทหารและโทรศัพท์โดย NATO และ CCITT ในช่วงทศวรรษ 1970 เข้ารหัสผลต่างระหว่างตัวอย่างที่ต่อเนื่องกันเป็นบิตเดียว — 1 ถ้าตัวอย่างปัจจุบันเกินค่าทำนาย 0 ในกรณีอื่น — ขณะที่ตัวกรอง syllabic companding ปรับขนาดสเต็ปโดยติดตามชุดบิตที่เหมือนกัน ทำงานที่ 16 ถึง 64 kbps CVSD สร้างสมดุลระหว่างความชัดเจนของเสียงพูดกับแบนด์วิดท์ ทำให้เป็นการเข้ารหัสที่เลือกใช้สำหรับลิงก์ทางทหารที่ปลอดภัยและระบบวิทยุยุทธวิธี บิตสตรีมสามารถถอดรหัสด้วยฮาร์ดแวร์ที่ตรงไปตรงมา ซึ่งเดิมทีสร้างในวงจรรวมเฉพาะ ข้อดีคือความเรียบง่ายในการนำไปใช้ — ตัวเข้ารหัสและถอดรหัสต้องการทรัพยากรน้อยที่สุด ทำให้ประมวลผลแบบเรียลไทม์บนฮาร์ดแวร์แบบฝังตัวที่ใช้พลังงานต่ำ ความทนทานภายใต้สภาวะที่มีสัญญาณรบกวนเป็นอีกจุดแข็ง เนื่องจากข้อผิดพลาดบิตเดียวส่งผลกระทบเฉพาะตัวอย่างในพื้นที่แทนที่จะทำลายเฟรมทั้งหมด SoX ให้การรองรับการเข้ารหัสและถอดรหัสด้วยซอฟต์แวร์ ทำให้ระบบสมัยใหม่สามารถทำงานกับการบันทึก CVSD เก่าจากคลังทหารและโครงสร้างพื้นฐานโทรคมนาคมรุ่นเก่า
ผู้พัฒนา: CCITT / NATO
เผยแพร่ครั้งแรก: 1970
SPH เป็นนามสกุลไฟล์สำหรับเสียงที่จัดเก็บในรูปแบบ NIST SPHERE (SPeech HEader REsources) มาตรฐานที่สร้างโดยสถาบันมาตรฐานและเทคโนโลยีแห่งชาติสหรัฐอเมริการาวปี 1990 สร้างขึ้นสำหรับการวิจัยด้านเสียงพูด ไฟล์ SPH มีส่วนหัว ASCII ขนาด 1024 ไบต์ที่บรรจุเมทาดาทา — ตัวระบุฐานข้อมูล จำนวนช่องสัญญาณ อัตราสุ่มตัวอย่าง ลำดับไบต์ และประเภทการบีบอัด — ทำให้ทุกการบันทึกอธิบายตัวเองได้ เสียงพื้นฐานโดยทั่วไปเป็น PCM เชิงเส้น 16 บิตที่สุ่มตัวอย่าง 16 kHz แม้ว่าจะอนุญาตให้ใช้การกำหนดค่าอื่นได้ นักวิจัยที่ NIST, DARPA และมหาวิทยาลัยทั่วโลกพึ่งพา SPH สำหรับการเผยแพร่คลังเสียงพูดเช่น TIMIT, Switchboard และคอลเลกชัน LDC ที่เป็นรากฐานของระบบการรู้จำเสียงพูดอัตโนมัติสมัยใหม่ ข้อดีสำคัญคือส่วนหัวที่อ่านได้ด้วยมนุษย์ ทำให้สคริปต์สามารถแยกวิเคราะห์เมทาดาทาการบันทึกได้โดยไม่ต้องถอดรหัสไบนารี การกำหนดมาตรฐานที่เข้มงวดของรูปแบบยังขจัดความกำกวมเมื่อแชร์ชุดข้อมูลข้ามสถาบันและแพลตฟอร์ม เนื่องจากไฟล์ SPH จัดเก็บ PCM แบบไม่บีบอัด จึงรักษาความเที่ยงตรงของเสียงอย่างเต็มที่ — สิ่งสำคัญอย่างยิ่งเมื่อฝึกแบบจำลองอะคูสติกที่แม้แต่สิ่งแปลกปลอมเล็กน้อยก็อาจบิดเบือนผลลัพธ์ได้
เผยแพร่ครั้งแรก: 1990

คำถามที่พบบ่อย

ทำไมต้องแปลง CVSD เป็น SPH?

CVSD จำกัดอยู่ที่คุณภาพเสียงระดับโทรศัพท์เท่านั้น การแปลงเป็น SPH ให้มาตรฐานสำหรับคลังข้อมูลการวิจัยการพูด

เปิดไฟล์เสียง SPH ได้อย่างไร?

สามารถเปิด SPH ด้วย HTK toolkit, SoX และเครื่องมือวิจัยการพูด

การแปลง CVSD เป็น SPH มีผลต่อคุณภาพหรือไม่?

SPH รักษาข้อมูลเสียงอย่างซื่อสัตย์ เนื่องจาก CVSD มีความเที่ยงตรงจำกัดอยู่แล้ว เอาต์พุต SPH จะตรงกับคุณภาพต้นฉบับ

แปลง CVSD เป็น SPH ได้บนทุกอุปกรณ์หรือไม่?

ได้ — ตัวแปลงทำงานทั้งหมดในเบราว์เซอร์ ใช้ได้บน Windows, macOS, Linux และมือถือ

แปลง CVSD หลายไฟล์พร้อมกันได้ไหม?

ได้ — อัปโหลดเสียง CVSD หลายไฟล์พร้อมกันแล้วจะถูกแปลงเป็น SPH แบบขนาน ประหยัดเวลา

การแปลง CVSD เป็น SPH มีค่าใช้จ่ายไหม?

การแปลงมาตรฐานไม่มีค่าใช้จ่าย แผนพรีเมียมปลดล็อกขีดจำกัดที่สูงขึ้นและการประมวลผลที่เร็วขึ้น