ตัวแปลง SOU เป็น SPH

แปลงเสียง SOU เป็นรูปแบบ SPH ออนไลน์ — ง่ายและรวดเร็ว

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

ขั้นตอนง่ายๆ

อัปโหลด SOU เลือก SPH แล้วดาวน์โหลด — สามขั้นตอน ไม่ต้องมีทักษะทางเทคนิค

ผลลัพธ์รวดเร็ว

การแปลง SOU เป็น SPH ส่วนใหญ่เสร็จในไม่กี่วินาที

อัปเกรดรูปแบบ

SOU เป็นรูปแบบเก่า การแปลงเป็น SPH นำเสียงเข้าสู่รูปแบบที่ HTK toolkit รู้จัก

วิธีแปลง SOU เป็น SPH

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ sph หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ sph ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

SOU เป็นการกำหนดรูปแบบเสียงดิบที่ทำหน้าที่เป็นนามแฝงสำหรับข้อมูล PCM แบบ 8 บิตไม่มีเครื่องหมาย (u8) ในเฟรมเวิร์กประมวลผลเสียง SoX ไฟล์ที่มีนามสกุล .sou ประกอบด้วยตัวอย่างเสียงดิบที่ไม่บีบอัดแบบไม่มีส่วนหัว จัดเก็บเป็นจำนวนเต็ม 8 บิตไม่มีเครื่องหมาย — แต่ละไบต์แทนค่าแอมพลิจูดเดียวตั้งแต่ 0 ถึง 255 โดย 128 เป็นจุดกลางที่เงียบ เนื่องจากไม่มีส่วนหัว พารามิเตอร์การเล่นเช่นอัตราสุ่มตัวอย่างและจำนวนช่องสัญญาณต้องระบุจากภายนอก ค่าเริ่มต้นโดยทั่วไปคือโมโนที่ 8000 Hz แม้ว่าข้อมูลจะแทนอัตราใดก็ได้ที่ฮาร์ดแวร์บันทึกรองรับ การเข้ารหัส u8 ที่ SOU เป็นนามแฝงเป็นหนึ่งในการแสดงเสียงดิจิทัลที่เรียบง่ายที่สุด มีมาก่อนคอนเทนเนอร์เสียงแบบมีโครงสร้างเช่น WAV และ AIFF PCM แบบดิบไม่มีเครื่องหมายถูกผลิตทั่วไปโดยการ์ดเสียงและดิจิไทเซอร์ยุคแรกในช่วงปลายทศวรรษ 1980 และต้นทศวรรษ 1990 เมื่อข้อจำกัดด้านพื้นที่จัดเก็บและพลังการประมวลผลทำให้รูปแบบที่ไม่มีส่วนหัวเป็นตัวเลือกที่เหมาะสม ข้อดีคือความเรียบง่ายอย่างสุดขั้ว — ไฟล์ SOU สามารถอ่านได้โดยโปรแกรมใดก็ได้ที่ทำ I/O ไฟล์พื้นฐาน โดยไม่ต้องแยกวิเคราะห์โครงสร้างคอนเทนเนอร์หรือถอดรหัสเมทาดาทา การแปลงเป็นคอนเทนเนอร์สมัยใหม่ใดๆ ก็ไม่สูญเสียคุณภาพและรวดเร็ว เนื่องจากสามารถห่อหุ้มตัวอย่าง PCM ดิบในส่วนหัว WAV หรือ AIFF ได้โดยไม่ต้องแปลงรหัสใดๆ
ผู้พัฒนา: SoX Contributors
เผยแพร่ครั้งแรก: 1991
SPH เป็นนามสกุลไฟล์สำหรับเสียงที่จัดเก็บในรูปแบบ NIST SPHERE (SPeech HEader REsources) มาตรฐานที่สร้างโดยสถาบันมาตรฐานและเทคโนโลยีแห่งชาติสหรัฐอเมริการาวปี 1990 สร้างขึ้นสำหรับการวิจัยด้านเสียงพูด ไฟล์ SPH มีส่วนหัว ASCII ขนาด 1024 ไบต์ที่บรรจุเมทาดาทา — ตัวระบุฐานข้อมูล จำนวนช่องสัญญาณ อัตราสุ่มตัวอย่าง ลำดับไบต์ และประเภทการบีบอัด — ทำให้ทุกการบันทึกอธิบายตัวเองได้ เสียงพื้นฐานโดยทั่วไปเป็น PCM เชิงเส้น 16 บิตที่สุ่มตัวอย่าง 16 kHz แม้ว่าจะอนุญาตให้ใช้การกำหนดค่าอื่นได้ นักวิจัยที่ NIST, DARPA และมหาวิทยาลัยทั่วโลกพึ่งพา SPH สำหรับการเผยแพร่คลังเสียงพูดเช่น TIMIT, Switchboard และคอลเลกชัน LDC ที่เป็นรากฐานของระบบการรู้จำเสียงพูดอัตโนมัติสมัยใหม่ ข้อดีสำคัญคือส่วนหัวที่อ่านได้ด้วยมนุษย์ ทำให้สคริปต์สามารถแยกวิเคราะห์เมทาดาทาการบันทึกได้โดยไม่ต้องถอดรหัสไบนารี การกำหนดมาตรฐานที่เข้มงวดของรูปแบบยังขจัดความกำกวมเมื่อแชร์ชุดข้อมูลข้ามสถาบันและแพลตฟอร์ม เนื่องจากไฟล์ SPH จัดเก็บ PCM แบบไม่บีบอัด จึงรักษาความเที่ยงตรงของเสียงอย่างเต็มที่ — สิ่งสำคัญอย่างยิ่งเมื่อฝึกแบบจำลองอะคูสติกที่แม้แต่สิ่งแปลกปลอมเล็กน้อยก็อาจบิดเบือนผลลัพธ์ได้
เผยแพร่ครั้งแรก: 1990

คำถามที่พบบ่อย

ทำไมต้องเปลี่ยนจาก SOU เป็น SPH?

SOU เป็นรูปแบบดิบไม่มีเฮดเดอร์ การแปลงเป็น SPH ให้มาตรฐานสำหรับคลังเสียงพูดวิจัย

ซอฟต์แวร์อะไรเปิดไฟล์ SPH?

เปิด SPH ได้ด้วย HTK toolkit, SoX และเครื่องมือวิจัยเสียงพูด

การแปลง SOU เป็น SPH มีผลต่อคุณภาพไหม?

SPH รักษาข้อมูลเสียง เอาต์พุตตรงกับคุณภาพต้นฉบับ

ใช้ได้ทุกแพลตฟอร์มไหม?

ใช้ได้ เปิดเบราว์เซอร์ อัปโหลดแล้วแปลง

เสียง SOU ถูกเก็บเป็นส่วนตัวไหม?

ไฟล์ SOU ถูกลบทันทีหลังแปลง ผลลัพธ์ SPH ถูกลบภายใน 24 ชั่วโมง

ต้องติดตั้งอะไรไหม?

ไม่ต้อง ตัวแปลงทำงานในเว็บเบราว์เซอร์ทั้งหมด