ตัวแปลง SLN เป็น SPH

เตรียมเสียงบันทึก Asterisk SLN สำหรับงานวิจัยเสียงพูด SPHERE

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

มาตรฐานวิจัยเสียงพูด

แปลงเสียงโทรศัพท์ SLN เป็น SPH — รูปแบบ SPHERE ที่ได้รับความเชื่อถือจาก NIST และชุมชนวิจัยภาษาศาสตร์

จาก PBX สู่คลังเสียง

เปลี่ยนเสียงบันทึกโทรศัพท์ Asterisk เป็นไฟล์ SPH พร้อมสำหรับการรู้จำเสียงพูดและการวิเคราะห์สัทศาสตร์

จัดการข้อมูลปลอดภัย

เสียงบันทึกโทรศัพท์เป็นความลับ ไฟล์ SLN ลบหลังแปลง ไฟล์ SPH ลบภายใน 24 ชั่วโมง

วิธีแปลง SLN เป็น SPH

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ sph หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ sph ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

SLN (Signed Linear) เป็นรูปแบบเสียงดิบแบบไม่มีส่วนหัว จัดเก็บตัวอย่าง PCM เชิงเส้นแบบมีเครื่องหมาย 16 บิตที่ 8000 Hz โมโน เกี่ยวข้องอย่างใกล้ชิดกับ Asterisk — เฟรมเวิร์ก PBX แบบโอเพนซอร์สที่พัฒนาโดย Digium (ปัจจุบันคือ Sangoma Technologies) ภายใน Asterisk SLN ทำหน้าที่เป็นการแสดงเสียงภายในดั้งเดิม — ทุกการแปลงโคเดกจะผ่าน signed linear เป็นขั้นตอนกลาง ทำให้ SLN เป็นกระดูกสันหลังของสถาปัตยกรรมการแปลโคเดกของ Asterisk รูปแบบนี้ไม่มีอะไรนอกจากตัวอย่างดิบ — ไม่มีส่วนหัว ไม่มีเมทาดาทา ไม่มีเฟรม — ดังนั้นพารามิเตอร์จะต้องทราบล่วงหน้า แม้ว่าการขาดการอธิบายตัวเองอาจดูเป็นข้อจำกัด แต่จริงๆ แล้วเป็นข้อดีในงานโทรศัพท์ที่รูปแบบตัวอย่างเป็นแบบตายตัวตามธรรมเนียมและทุกไบต์โอเวอร์เฮดมีความสำคัญเมื่อมีช่องสัญญาณพร้อมกันหลายพันช่อง อัตรา 8000 Hz สอดคล้องกับมาตรฐาน G.711 สำหรับโทรศัพท์แบบดั้งเดิม ครอบคลุมแบนด์เสียงพูดเต็ม 300-3400 Hz Asterisk ยังรองรับตัวแปรเพิ่มเติม (sln16, sln32, sln48) สำหรับเสียงแบนด์กว้าง ไฟล์ SLN ไม่ต้องการการถอดรหัส — เพียงแค่แมปหน่วยความจำโดยตรง — ทำให้เหมาะอย่างยิ่งสำหรับการมิกซ์แบบเรียลไทม์ การประชุมทางเสียง และการเล่นพรอมต์ในสภาพแวดล้อม VoIP ที่มีความหนาแน่นสูง
ผู้พัฒนา: Digium (now Sangoma Technologies)
เผยแพร่ครั้งแรก: 1999
SPH เป็นนามสกุลไฟล์สำหรับเสียงที่จัดเก็บในรูปแบบ NIST SPHERE (SPeech HEader REsources) มาตรฐานที่สร้างโดยสถาบันมาตรฐานและเทคโนโลยีแห่งชาติสหรัฐอเมริการาวปี 1990 สร้างขึ้นสำหรับการวิจัยด้านเสียงพูด ไฟล์ SPH มีส่วนหัว ASCII ขนาด 1024 ไบต์ที่บรรจุเมทาดาทา — ตัวระบุฐานข้อมูล จำนวนช่องสัญญาณ อัตราสุ่มตัวอย่าง ลำดับไบต์ และประเภทการบีบอัด — ทำให้ทุกการบันทึกอธิบายตัวเองได้ เสียงพื้นฐานโดยทั่วไปเป็น PCM เชิงเส้น 16 บิตที่สุ่มตัวอย่าง 16 kHz แม้ว่าจะอนุญาตให้ใช้การกำหนดค่าอื่นได้ นักวิจัยที่ NIST, DARPA และมหาวิทยาลัยทั่วโลกพึ่งพา SPH สำหรับการเผยแพร่คลังเสียงพูดเช่น TIMIT, Switchboard และคอลเลกชัน LDC ที่เป็นรากฐานของระบบการรู้จำเสียงพูดอัตโนมัติสมัยใหม่ ข้อดีสำคัญคือส่วนหัวที่อ่านได้ด้วยมนุษย์ ทำให้สคริปต์สามารถแยกวิเคราะห์เมทาดาทาการบันทึกได้โดยไม่ต้องถอดรหัสไบนารี การกำหนดมาตรฐานที่เข้มงวดของรูปแบบยังขจัดความกำกวมเมื่อแชร์ชุดข้อมูลข้ามสถาบันและแพลตฟอร์ม เนื่องจากไฟล์ SPH จัดเก็บ PCM แบบไม่บีบอัด จึงรักษาความเที่ยงตรงของเสียงอย่างเต็มที่ — สิ่งสำคัญอย่างยิ่งเมื่อฝึกแบบจำลองอะคูสติกที่แม้แต่สิ่งแปลกปลอมเล็กน้อยก็อาจบิดเบือนผลลัพธ์ได้
เผยแพร่ครั้งแรก: 1990

คำถามที่พบบ่อย

ทำไมต้องแปลง SLN เป็น SPH?

SPH (SPHERE) เป็นรูปแบบมาตรฐานสำหรับคลังเสียงพูดในงานวิจัยภาษาศาสตร์ การแปลง SLN ทำให้เสียงโทรศัพท์พร้อมสำหรับการวิเคราะห์

อะไรใช้ไฟล์ SPH?

เครื่องมือเสียงพูด NIST, HTK, Kaldi และเฟรมเวิร์กวิจัยภาษาศาสตร์ทำงานกับข้อมูลเสียงรูปแบบ SPHERE ทั้งหมด

SPH เพิ่มข้อมูลเมตาไหม?

ใช่ — รูปแบบ SPHERE มีส่วนหัวข้อความที่อุดมด้วยข้อมูลเมตา เช่น ข้อมูลผู้พูด สภาพการบันทึก และการอ้างอิงการถอดเสียง

แปลงเป็นชุดได้ไหม?

อัปโหลดไฟล์ SLN หลายไฟล์แล้วแปลงเป็น SPH ทั้งหมดในเซสชันเดียว — เหมาะสำหรับสร้างชุดข้อมูลวิจัยเสียงพูด

การแปลงปลอดภัยไหม?

ไฟล์ SLN จะถูกลบหลังประมวลผล และไฟล์ SPH จะถูกลบจากเซิร์ฟเวอร์ภายใน 24 ชั่วโมง