ตัวแปลง DSS เป็น NIST

แปลงเสียง DSS เป็น NIST ออนไลน์

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

บันทึกเสียงเป็น NIST

ปลดปล่อยบันทึกเสียง DSS จากซอฟต์แวร์เฉพาะของ Olympus/Philips — แปลงเป็น NIST สำหรับการใช้งานที่กว้างขึ้น

ไม่ต้องซอฟต์แวร์บันทึกเสียง

การแปลง DSS เป็น NIST ดำเนินการอย่างแม่นยำเพื่อรักษาคุณภาพเสียง

ประมวลผลอย่างปลอดภัย

ไฟล์บันทึกเสียง DSS ที่อัปโหลดจะถูกลบหลังแปลง ไฟล์เอาต์พุตจะถูกลบจากเซิร์ฟเวอร์ภายใน 24 ชั่วโมง

วิธีแปลง DSS เป็น NIST

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ nist หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ nist ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

DSS (Digital Speech Standard) เป็นรูปแบบบันทึกเสียงพูดที่เป็นกรรมสิทธิ์ พัฒนาโดย Olympus, Philips และ Grundig ในปี 1994 ผ่าน International Voice Association สร้างมาสำหรับเวิร์กโฟลว์การบอกคำบอก DSS ใช้การบีบอัดที่ปรับให้เหมาะกับเสียงพูดที่อัตราบิตต่ำมาก — มาตรฐานดั้งเดิมเข้ารหัสที่ประมาณ 13.7 kbps ขณะที่ DSS Pro ให้ประมาณ 28 kbps พร้อมความชัดเจนที่ดีขึ้น ตัวแปลงสัญญาณจัดสรรงบประมาณไปยังช่วงความถี่ที่เป็นลักษณะเฉพาะของเสียงพูดมนุษย์แทนที่จะเป็นเสียงแบบสเปกตรัมเต็ม สร้างไฟล์ที่กะทัดรัดเป็นพิเศษ เครื่องบันทึกมืออาชีพจาก Olympus และ Philips ใช้ DSS เป็นค่าเริ่มต้น ผสานรวมกับซอฟต์แวร์ถอดความที่รองรับธงจัดลำดับความสำคัญ บุ๊กมาร์ก และการระบุผู้เขียนในเมตาดาต้าของไฟล์ ข้อดีคือประสิทธิภาพขนาดไฟล์: การบอกคำบอกหนึ่งชั่วโมงใช้เพียง 6-12 MB เหมาะสำหรับสภาพแวดล้อมที่มีปริมาณมาก เช่น โรงพยาบาล สำนักงานกฎหมาย และศาล เมตาดาต้าในตัวช่วยให้สามารถจัดเส้นทางผ่านคิวถอดความได้อย่างราบรื่นพร้อมการจัดเรียงลำดับความสำคัญอัตโนมัติ แม้ DSS จะเป็นรูปแบบปิดที่จำกัดการเล่นเฉพาะซอฟต์แวร์ที่เข้ากันได้ แต่ความโดดเด่นในการบอกคำบอกระดับมืออาชีพรับประกันการรองรับอย่างต่อเนื่องจากแพลตฟอร์มถอดความหลัก
ผู้พัฒนา: Olympus / Philips / Grundig
เผยแพร่ครั้งแรก: 1994
NIST SPHERE (SPeech HEader REsources) เป็นรูปแบบไฟล์เสียงเฉพาะทางที่สร้างโดย สถาบันมาตรฐานและเทคโนโลยีแห่งชาติ สำหรับการวิจัยเสียงพูด โดยเฉพาะโปรเจกต์ที่ได้รับทุนจาก DARPA รูปแบบนี้ห่อหุ้มตัวอย่างเสียงดิบด้วยส่วนหัว ASCII ที่มีโครงสร้างซึ่งเข้ารหัสเมตาดาต้า เช่น อัตราสุ่มตัวอย่าง จำนวนแชนเนล ประเภทการเข้ารหัส ข้อมูลประชากรผู้พูด และคำอธิบายการถอดความ — เหมาะอย่างยิ่งสำหรับการเผยแพร่คอร์ปัสเสียงพูด ไฟล์ NIST มักเก็บ PCM แบบไม่บีบอัดหรือเสียง mu-law ที่อัตราสุ่มตัวอย่างคุณภาพโทรศัพท์ (8 kHz หรือ 16 kHz) แม้คอนเทนเนอร์จะยืดหยุ่นพอรองรับการเข้ารหัสหลายแบบ ข้อดีสำคัญคือส่วนหัวแบบบันทึกตัวเองที่หลากหลาย ช่วยให้นักวิจัยฝังเมตาดาต้าคอร์ปัสโดยละเอียดในไฟล์โดยตรง ไม่ต้องมีไฟล์ข้างเคียง SPHERE ยังกลายเป็นมาตรฐานที่ใช้จริงสำหรับฐานข้อมูลเสียงพูดหลัก ๆ เช่น TIMIT, Switchboard และคอร์ปัส Fisher รับประกันการรับรู้อย่างกว้างขวางในห้องปฏิบัติการทั้งด้านวิชาการและภาครัฐ ข้อกำหนดแบบเปิดและเครื่องมือบรรทัดคำสั่งที่มีให้ (sphere, h_strip, w_decode) ทำให้สามารถแปลง ตรวจสอบ และประมวลผลไฟล์เหล่านี้ทางโปรแกรมได้อย่างตรงไปตรงมาในไปป์ไลน์ประมวลผลเสียงพูด
เผยแพร่ครั้งแรก: 1990

คำถามที่พบบ่อย

ทำไมต้องแปลง DSS เป็น NIST?

ซอฟต์แวร์เสียงหลายตัวรองรับรูปแบบ NIST รวมถึง SoX และเครื่องมือเฉพาะทางอื่นๆ

เปิดไฟล์ NIST ด้วยอะไร?

SoX, Kaldi, HTK, NIST tools สามารถเปิดและเล่นไฟล์ NIST ได้โดยไม่ต้องติดตั้งโคเดกหรือตั้งค่าเพิ่มเติม

รูปแบบ DSS คืออะไร?

DSS (Digital Speech Standard) เป็นรูปแบบบันทึกเสียงเฉพาะที่พัฒนาโดย Olympus และ Philips สำหรับเครื่องบันทึกเสียงที่ใช้ในงานแพทย์ กฎหมาย และธุรกิจ

คุณภาพเสียงจะถูกรักษาไว้ไหม?

DSS เป็นโคเดกเน้นเสียงพูดที่มีแบนด์วิดท์จำกัด การแปลงจะถ่ายโอนความชัดเจนของเสียงทั้งหมดจากไฟล์ DSS ต้นทางไปยังเอาต์พุต NIST

แปลงไฟล์ DSS แบบกลุ่มได้ไหม?

อัปโหลดไฟล์บันทึกเสียง DSS หลายไฟล์แล้วแปลงเป็น NIST พร้อมกัน — มีประสิทธิภาพสำหรับการประมวลผลไฟล์เสียงจำนวนมาก