ตัวแปลง SPH เป็น VOX

แปลง SPH เป็น VOX ได้รวดเร็วโดยไม่ต้องติดตั้ง

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

ผลลัพธ์สะอาด

การแปลง SPH เป็น VOX รักษาคุณภาพเสียงของคุณ เอนจินจัดการข้อมูลเสียงพูดอย่างแม่นยำและถูกต้อง

ประมวลผลบนคลาวด์

เซิร์ฟเวอร์ของเราจัดการการประมวลผล SPH เป็น VOX ทั้งหมด คอมพิวเตอร์หรือโทรศัพท์ของคุณยังคงตอบสนองได้ดี

ข้อมูลได้รับการปกป้อง

ไฟล์ SPH ที่อัปโหลดจะถูกลบทันทีหลังประมวลผล ไฟล์ VOX ที่ได้จะถูกลบอัตโนมัติภายใน 24 ชั่วโมง

วิธีแปลง SPH เป็น VOX

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ vox หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ vox ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

SPH เป็นนามสกุลไฟล์สำหรับเสียงที่จัดเก็บในรูปแบบ NIST SPHERE (SPeech HEader REsources) มาตรฐานที่สร้างโดยสถาบันมาตรฐานและเทคโนโลยีแห่งชาติสหรัฐอเมริการาวปี 1990 สร้างขึ้นสำหรับการวิจัยด้านเสียงพูด ไฟล์ SPH มีส่วนหัว ASCII ขนาด 1024 ไบต์ที่บรรจุเมทาดาทา — ตัวระบุฐานข้อมูล จำนวนช่องสัญญาณ อัตราสุ่มตัวอย่าง ลำดับไบต์ และประเภทการบีบอัด — ทำให้ทุกการบันทึกอธิบายตัวเองได้ เสียงพื้นฐานโดยทั่วไปเป็น PCM เชิงเส้น 16 บิตที่สุ่มตัวอย่าง 16 kHz แม้ว่าจะอนุญาตให้ใช้การกำหนดค่าอื่นได้ นักวิจัยที่ NIST, DARPA และมหาวิทยาลัยทั่วโลกพึ่งพา SPH สำหรับการเผยแพร่คลังเสียงพูดเช่น TIMIT, Switchboard และคอลเลกชัน LDC ที่เป็นรากฐานของระบบการรู้จำเสียงพูดอัตโนมัติสมัยใหม่ ข้อดีสำคัญคือส่วนหัวที่อ่านได้ด้วยมนุษย์ ทำให้สคริปต์สามารถแยกวิเคราะห์เมทาดาทาการบันทึกได้โดยไม่ต้องถอดรหัสไบนารี การกำหนดมาตรฐานที่เข้มงวดของรูปแบบยังขจัดความกำกวมเมื่อแชร์ชุดข้อมูลข้ามสถาบันและแพลตฟอร์ม เนื่องจากไฟล์ SPH จัดเก็บ PCM แบบไม่บีบอัด จึงรักษาความเที่ยงตรงของเสียงอย่างเต็มที่ — สิ่งสำคัญอย่างยิ่งเมื่อฝึกแบบจำลองอะคูสติกที่แม้แต่สิ่งแปลกปลอมเล็กน้อยก็อาจบิดเบือนผลลัพธ์ได้
เผยแพร่ครั้งแรก: 1990
VOX เป็นรูปแบบเสียงแบบไม่มีส่วนหัวที่สร้างขึ้นรอบการเข้ารหัส Dialogic ADPCM ถูกนำมาใช้อย่างแพร่หลายในระบบโทรศัพท์ ระบบตอบรับด้วยเสียงอัตโนมัติ (IVR) และแพลตฟอร์มวอยซ์เมลตั้งแต่ทศวรรษ 1980 ตัวอย่างเสียงแต่ละตัวถูกบีบอัดเป็น 4 บิตโดยใช้อัลกอริทึมที่พัฒนาโดย Oki Electric และนำไปใช้ในฮาร์ดแวร์บนการ์ดอินเทอร์เฟซโทรศัพท์ของ Dialogic Corporation ไฟล์ VOX โดยทั่วไปใช้อัตราสุ่มตัวอย่าง 6000 หรือ 8000 Hz สร้างการบันทึกที่กระทัดรัดมากซึ่งปรับแต่งสำหรับความชัดเจนของเสียงพูดมากกว่าความเที่ยงตรงทางดนตรี เนื่องจากรูปแบบไม่มีส่วนหัว ซอฟต์แวร์เล่นต้องทราบอัตราสุ่มตัวอย่างและพารามิเตอร์การเข้ารหัสล่วงหน้า — ข้อแลกเปลี่ยนที่ลดโอเวอร์เฮดแต่ต้องการการจัดการไฟล์อย่างระมัดระวัง ข้อดีหลักของ VOX คือประสิทธิภาพในการจัดเก็บ — การบันทึกเสียงหนึ่งนาทีที่ 8 kHz ใช้พื้นที่ประมาณ 240 KB ทำให้เหมาะสมสำหรับระบบที่จัดเก็บพรอมต์หลายพันรายการ Dialogic ADPCM สอดคล้องกับมาตรฐาน ITU-T G.726 รับประกันความเข้ากันได้ข้ามอุปกรณ์โทรศัพท์จากผู้ผลิตต่างๆ แม้ว่าศูนย์บริการลูกค้าสมัยใหม่จะย้ายไปสู่ระบบ IP พร้อมโคเดกอย่าง Opus แต่ไลบรารี VOX จำนวนมากยังคงมีอยู่ในระบบ IVR เดิมและคลังเก็บถาวรเพื่อการปฏิบัติตามกฎระเบียบทั่วโลก
ผู้พัฒนา: Dialogic Corporation
เผยแพร่ครั้งแรก: 1983

คำถามที่พบบ่อย

ทำไมต้องแปลง SPH เป็น VOX?

ไฟล์ SPH มีขนาดใหญ่เกินไปสำหรับข้อความเสียง IVR VOX ใช้ Dialogic ADPCM เพื่อบีบอัดเสียงพูดสำหรับระบบโทรศัพท์

เปิดไฟล์เสียง VOX ด้วยอะไรได้บ้าง?

เปิด VOX ได้ด้วย SoX, GoldWave, ระบบโทรศัพท์ Dialogic หรือแพลตฟอร์มเสียง IVR

การแปลง SPH เป็น VOX ใช้เวลานานไหม?

ไฟล์ SPH ส่วนใหญ่แปลงเป็น VOX ภายในไม่กี่วินาที ระบบประมวลผลบนคลาวด์ถูกปรับแต่งเพื่อการแปลงเสียงที่รวดเร็ว

ใช้อุปกรณ์อะไรแปลง SPH เป็น VOX ได้บ้าง?

อุปกรณ์ใดก็ได้ที่มีเบราว์เซอร์ — Windows, macOS, Linux, ChromeOS, iOS, Android เครื่องมือนี้ไม่มีข้อจำกัดระบบปฏิบัติการ

สามารถเปลี่ยนการตั้งค่าเสียงก่อนแปลง SPH เป็น VOX ได้ไหม?

พารามิเตอร์เสียง เช่น อัตราสุ่มตัวอย่าง ช่องเสียง และคุณภาพ สามารถปรับได้ก่อนเริ่มแปลง SPH เป็น VOX

การแปลง SPH เป็น VOX เป็นแบบไม่สูญเสียคุณภาพหรือไม่?

เมื่อเป้าหมายเป็นรูปแบบ lossless ข้อมูลเสียงจากไฟล์ SPH จะถูกรักษาไว้ทั้งหมด รูปแบบ lossy จะใช้การบีบอัดเชิงรับรู้