SPX to SPH Converter

แปลงเสียง Speex เป็นรูปแบบ NIST SPH speech header

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

รูปแบบ Speech Corpus

แปลงการบันทึก SPX เป็นรูปแบบ NIST SPHERE — มาตรฐานทองสำหรับแจกจ่าย speech research dataset ทั่วโลก

เข้ากันได้กับงานวิจัย

ไฟล์ SPH ใช้งานได้กับ Kaldi, HTK, Praat และ speech processing toolkit หลักทั้งหมดที่ใช้ใน NLP และงานวิจัยเสียง

ความเป็นส่วนตัวของข้อมูล

ไฟล์ SPX ที่อัปโหลดจะถูกลบหลังการแปลง เอาต์พุต SPH จะถูกลบออกจากเซิร์ฟเวอร์ภายใน 24 ชั่วโมง

วิธีแปลง SPX เป็น SPH

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ sph หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ sph ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

Speex เป็นโคเดกเสียงโอเพนซอร์สที่สร้างขึ้นโดยเฉพาะสำหรับการบีบอัดเสียงพูด พัฒนาโดย Jean-Marc Valin ภายใต้ Xiph.Org Foundation เปิดตัวครั้งแรกในเดือนตุลาคม 2002 โดยมุ่งเป้าไปที่การสื่อสารด้วยเสียงผ่าน IP การประชุมทางเสียง และทุกสถานการณ์ที่ต้องส่งเสียงพูดอย่างมีประสิทธิภาพผ่านเครือข่าย ไฟล์ SPX บรรจุเสียงที่เข้ารหัสด้วย Speex ในคอนเทนเนอร์ Ogg ผสมผสานการปรับแต่งเสียงพูดของโคเดกกับความสามารถในการสตรีมของ Ogg รองรับอัตราสุ่มตัวอย่างสามระดับ — แบนด์แคบที่ 8 kHz แบนด์กว้างที่ 16 kHz และอัลตราแบนด์กว้างที่ 32 kHz — พร้อมการเข้ารหัสบิตเรตแปรผันที่ปรับตัวแบบเรียลไทม์ตามความซับซ้อนของเสียงพูด ข้อดีที่โดดเด่นคือลักษณะที่ปลอดสิทธิบัตรภายใต้สัญญาอนุญาต BSD ซึ่งให้นักพัฒนาฝังไว้ในผลิตภัณฑ์ทั้งเชิงพาณิชย์และโอเพนซอร์สได้อย่างอิสระ Speex ยังรวมการตัดเสียงสะท้อน การระงับเสียงรบกวน และการควบคุมอัตราขยายอัตโนมัติ — ฟีเจอร์ที่โคเดกคู่แข่งมักมอบหมายให้ไลบรารีภายนอก แม้ว่าผู้สร้างจะแนะนำ Opus อย่างเป็นทางการเป็นตัวสืบทอดตั้งแต่ปี 2012 แต่ Speex ยังคงถูกใช้งานในระบบ VoIP เดิม การบันทึกที่เก็บถาวร และอุปกรณ์ฝังตัวที่ตัวถอดรหัสที่ใช้ทรัพยากรน้อยยังคงมีคุณค่า
ผู้พัฒนา: Xiph.Org Foundation
เผยแพร่ครั้งแรก: 15 ตุลาคม 2002
SPH เป็นนามสกุลไฟล์สำหรับเสียงที่จัดเก็บในรูปแบบ NIST SPHERE (SPeech HEader REsources) มาตรฐานที่สร้างโดยสถาบันมาตรฐานและเทคโนโลยีแห่งชาติสหรัฐอเมริการาวปี 1990 สร้างขึ้นสำหรับการวิจัยด้านเสียงพูด ไฟล์ SPH มีส่วนหัว ASCII ขนาด 1024 ไบต์ที่บรรจุเมทาดาทา — ตัวระบุฐานข้อมูล จำนวนช่องสัญญาณ อัตราสุ่มตัวอย่าง ลำดับไบต์ และประเภทการบีบอัด — ทำให้ทุกการบันทึกอธิบายตัวเองได้ เสียงพื้นฐานโดยทั่วไปเป็น PCM เชิงเส้น 16 บิตที่สุ่มตัวอย่าง 16 kHz แม้ว่าจะอนุญาตให้ใช้การกำหนดค่าอื่นได้ นักวิจัยที่ NIST, DARPA และมหาวิทยาลัยทั่วโลกพึ่งพา SPH สำหรับการเผยแพร่คลังเสียงพูดเช่น TIMIT, Switchboard และคอลเลกชัน LDC ที่เป็นรากฐานของระบบการรู้จำเสียงพูดอัตโนมัติสมัยใหม่ ข้อดีสำคัญคือส่วนหัวที่อ่านได้ด้วยมนุษย์ ทำให้สคริปต์สามารถแยกวิเคราะห์เมทาดาทาการบันทึกได้โดยไม่ต้องถอดรหัสไบนารี การกำหนดมาตรฐานที่เข้มงวดของรูปแบบยังขจัดความกำกวมเมื่อแชร์ชุดข้อมูลข้ามสถาบันและแพลตฟอร์ม เนื่องจากไฟล์ SPH จัดเก็บ PCM แบบไม่บีบอัด จึงรักษาความเที่ยงตรงของเสียงอย่างเต็มที่ — สิ่งสำคัญอย่างยิ่งเมื่อฝึกแบบจำลองอะคูสติกที่แม้แต่สิ่งแปลกปลอมเล็กน้อยก็อาจบิดเบือนผลลัพธ์ได้
เผยแพร่ครั้งแรก: 1990

คำถามที่พบบ่อย

ทำไมต้องแปลง SPX เป็น SPH?

SPH (NIST SPHERE) คือรูปแบบมาตรฐานสำหรับ speech research corpus การแปลงจาก SPX เตรียมการบันทึกสำหรับงานวิจัยภาษาศาสตร์และเสียง

NIST SPHERE คืออะไร?

SPHERE (SPeech HEader Resources) พัฒนาโดย NIST สำหรับการแจกจ่ายข้อมูลเสียงพูดมาตรฐานในชุมชนวิจัย

เครื่องมืออะไรใช้งานได้กับ SPH?

NIST SPHERE toolkit, HTK, Kaldi, Praat และ speech processing framework หลักรองรับไฟล์ SPH โดยตรง

SPH ใช้ใน speech recognition ไหม?

ใช่ — speech corpus หลักส่วนใหญ่ (TIMIT, Switchboard เป็นต้น) แจกจ่ายในรูปแบบ SPH สำหรับฝึก recognition model

แปลงฟรีไหม?

ใช่ — ฟรีที่ convertio.cloud สำหรับการใช้งานมาตรฐาน