ตัวแปลง SOU เป็น NIST

นำเสียง SOU เข้าสู่ NIST — แปลงออนไลน์ง่ายๆ

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

ไม่ต้องติดตั้งอะไร

ทุกอย่างเกิดขึ้นในเบราว์เซอร์ — ไม่มีปลั๊กอิน ไม่ต้องติดตั้ง เปิดหน้าเว็บแล้วแปลง

ความเข้ากันได้ดีขึ้น

SOU เป็นรูปแบบเก่า การแปลงเป็น NIST นำเสียงเข้าสู่รูปแบบที่ HTK toolkit รู้จัก

ใช้งานง่าย

อัปโหลดไฟล์ SOU เลือก NIST แล้วดาวน์โหลด — สามขั้นตอน ไม่ต้องมีทักษะทางเทคนิค

วิธีแปลง SOU เป็น NIST

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ nist หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ nist ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

SOU เป็นการกำหนดรูปแบบเสียงดิบที่ทำหน้าที่เป็นนามแฝงสำหรับข้อมูล PCM แบบ 8 บิตไม่มีเครื่องหมาย (u8) ในเฟรมเวิร์กประมวลผลเสียง SoX ไฟล์ที่มีนามสกุล .sou ประกอบด้วยตัวอย่างเสียงดิบที่ไม่บีบอัดแบบไม่มีส่วนหัว จัดเก็บเป็นจำนวนเต็ม 8 บิตไม่มีเครื่องหมาย — แต่ละไบต์แทนค่าแอมพลิจูดเดียวตั้งแต่ 0 ถึง 255 โดย 128 เป็นจุดกลางที่เงียบ เนื่องจากไม่มีส่วนหัว พารามิเตอร์การเล่นเช่นอัตราสุ่มตัวอย่างและจำนวนช่องสัญญาณต้องระบุจากภายนอก ค่าเริ่มต้นโดยทั่วไปคือโมโนที่ 8000 Hz แม้ว่าข้อมูลจะแทนอัตราใดก็ได้ที่ฮาร์ดแวร์บันทึกรองรับ การเข้ารหัส u8 ที่ SOU เป็นนามแฝงเป็นหนึ่งในการแสดงเสียงดิจิทัลที่เรียบง่ายที่สุด มีมาก่อนคอนเทนเนอร์เสียงแบบมีโครงสร้างเช่น WAV และ AIFF PCM แบบดิบไม่มีเครื่องหมายถูกผลิตทั่วไปโดยการ์ดเสียงและดิจิไทเซอร์ยุคแรกในช่วงปลายทศวรรษ 1980 และต้นทศวรรษ 1990 เมื่อข้อจำกัดด้านพื้นที่จัดเก็บและพลังการประมวลผลทำให้รูปแบบที่ไม่มีส่วนหัวเป็นตัวเลือกที่เหมาะสม ข้อดีคือความเรียบง่ายอย่างสุดขั้ว — ไฟล์ SOU สามารถอ่านได้โดยโปรแกรมใดก็ได้ที่ทำ I/O ไฟล์พื้นฐาน โดยไม่ต้องแยกวิเคราะห์โครงสร้างคอนเทนเนอร์หรือถอดรหัสเมทาดาทา การแปลงเป็นคอนเทนเนอร์สมัยใหม่ใดๆ ก็ไม่สูญเสียคุณภาพและรวดเร็ว เนื่องจากสามารถห่อหุ้มตัวอย่าง PCM ดิบในส่วนหัว WAV หรือ AIFF ได้โดยไม่ต้องแปลงรหัสใดๆ
ผู้พัฒนา: SoX Contributors
เผยแพร่ครั้งแรก: 1991
NIST SPHERE (SPeech HEader REsources) เป็นรูปแบบไฟล์เสียงเฉพาะทางที่สร้างโดย สถาบันมาตรฐานและเทคโนโลยีแห่งชาติ สำหรับการวิจัยเสียงพูด โดยเฉพาะโปรเจกต์ที่ได้รับทุนจาก DARPA รูปแบบนี้ห่อหุ้มตัวอย่างเสียงดิบด้วยส่วนหัว ASCII ที่มีโครงสร้างซึ่งเข้ารหัสเมตาดาต้า เช่น อัตราสุ่มตัวอย่าง จำนวนแชนเนล ประเภทการเข้ารหัส ข้อมูลประชากรผู้พูด และคำอธิบายการถอดความ — เหมาะอย่างยิ่งสำหรับการเผยแพร่คอร์ปัสเสียงพูด ไฟล์ NIST มักเก็บ PCM แบบไม่บีบอัดหรือเสียง mu-law ที่อัตราสุ่มตัวอย่างคุณภาพโทรศัพท์ (8 kHz หรือ 16 kHz) แม้คอนเทนเนอร์จะยืดหยุ่นพอรองรับการเข้ารหัสหลายแบบ ข้อดีสำคัญคือส่วนหัวแบบบันทึกตัวเองที่หลากหลาย ช่วยให้นักวิจัยฝังเมตาดาต้าคอร์ปัสโดยละเอียดในไฟล์โดยตรง ไม่ต้องมีไฟล์ข้างเคียง SPHERE ยังกลายเป็นมาตรฐานที่ใช้จริงสำหรับฐานข้อมูลเสียงพูดหลัก ๆ เช่น TIMIT, Switchboard และคอร์ปัส Fisher รับประกันการรับรู้อย่างกว้างขวางในห้องปฏิบัติการทั้งด้านวิชาการและภาครัฐ ข้อกำหนดแบบเปิดและเครื่องมือบรรทัดคำสั่งที่มีให้ (sphere, h_strip, w_decode) ทำให้สามารถแปลง ตรวจสอบ และประมวลผลไฟล์เหล่านี้ทางโปรแกรมได้อย่างตรงไปตรงมาในไปป์ไลน์ประมวลผลเสียงพูด
เผยแพร่ครั้งแรก: 1990

คำถามที่พบบ่อย

ทำไม NIST ถึงเป็นตัวเลือกที่ดีกว่า SOU?

SOU เป็นรูปแบบ 8 บิตที่ซอฟต์แวร์หลักไม่รู้จัก การแปลงเป็น NIST ให้มาตรฐานฐานข้อมูลเสียงพูด NIST

เปิดไฟล์ NIST ด้วยอะไรได้บ้าง?

เปิด NIST ได้ด้วย HTK toolkit, SoX และซอฟต์แวร์วิจัยเสียงพูด

การแปลง SOU เป็น NIST มีผลต่อคุณภาพไหม?

NIST รักษาข้อมูลเสียงอย่างซื่อสัตย์ เอาต์พุตตรงกับคุณภาพต้นฉบับ

แปลงจากมือถือได้ไหม?

ได้ ตัวแปลงใช้งานได้ทุกแพลตฟอร์มที่มีเว็บเบราว์เซอร์

มีข้อจำกัดไหม?

การแปลงมาตรฐานใช้งานได้โดยไม่มีข้อจำกัด แผนพรีเมียมให้ความเร็วเพิ่มเติม

ต้องลงทะเบียนก่อนไหม?

ไม่ต้อง เพียงอัปโหลด SOU เลือก NIST แล้วดาวน์โหลด