SPX to NIST Converter

แปลงเสียงพูด Speex เป็นรูปแบบ NIST standard audio

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

รูปแบบวิจัยมาตรฐาน

ย้ายการบันทึก Speex เข้าสู่มาตรฐาน NIST — ใช้งานได้กับ speaker recognition evaluation และ speech benchmark

แปลงบนคลาวด์

ไม่ต้องติดตั้ง NIST SPHERE toolkit ในเครื่อง แปลง SPX เป็น NIST โดยตรงผ่าน cloud service ของเรา

Workflow ที่ปลอดภัย

อัปโหลด SPX จะถูกลบหลังการแปลง เอาต์พุต NIST จะถูกลบออกจากเซิร์ฟเวอร์ภายใน 24 ชั่วโมง

วิธีแปลง SPX เป็น NIST

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ nist หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ nist ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

Speex เป็นโคเดกเสียงโอเพนซอร์สที่สร้างขึ้นโดยเฉพาะสำหรับการบีบอัดเสียงพูด พัฒนาโดย Jean-Marc Valin ภายใต้ Xiph.Org Foundation เปิดตัวครั้งแรกในเดือนตุลาคม 2002 โดยมุ่งเป้าไปที่การสื่อสารด้วยเสียงผ่าน IP การประชุมทางเสียง และทุกสถานการณ์ที่ต้องส่งเสียงพูดอย่างมีประสิทธิภาพผ่านเครือข่าย ไฟล์ SPX บรรจุเสียงที่เข้ารหัสด้วย Speex ในคอนเทนเนอร์ Ogg ผสมผสานการปรับแต่งเสียงพูดของโคเดกกับความสามารถในการสตรีมของ Ogg รองรับอัตราสุ่มตัวอย่างสามระดับ — แบนด์แคบที่ 8 kHz แบนด์กว้างที่ 16 kHz และอัลตราแบนด์กว้างที่ 32 kHz — พร้อมการเข้ารหัสบิตเรตแปรผันที่ปรับตัวแบบเรียลไทม์ตามความซับซ้อนของเสียงพูด ข้อดีที่โดดเด่นคือลักษณะที่ปลอดสิทธิบัตรภายใต้สัญญาอนุญาต BSD ซึ่งให้นักพัฒนาฝังไว้ในผลิตภัณฑ์ทั้งเชิงพาณิชย์และโอเพนซอร์สได้อย่างอิสระ Speex ยังรวมการตัดเสียงสะท้อน การระงับเสียงรบกวน และการควบคุมอัตราขยายอัตโนมัติ — ฟีเจอร์ที่โคเดกคู่แข่งมักมอบหมายให้ไลบรารีภายนอก แม้ว่าผู้สร้างจะแนะนำ Opus อย่างเป็นทางการเป็นตัวสืบทอดตั้งแต่ปี 2012 แต่ Speex ยังคงถูกใช้งานในระบบ VoIP เดิม การบันทึกที่เก็บถาวร และอุปกรณ์ฝังตัวที่ตัวถอดรหัสที่ใช้ทรัพยากรน้อยยังคงมีคุณค่า
ผู้พัฒนา: Xiph.Org Foundation
เผยแพร่ครั้งแรก: 15 ตุลาคม 2002
NIST SPHERE (SPeech HEader REsources) เป็นรูปแบบไฟล์เสียงเฉพาะทางที่สร้างโดย สถาบันมาตรฐานและเทคโนโลยีแห่งชาติ สำหรับการวิจัยเสียงพูด โดยเฉพาะโปรเจกต์ที่ได้รับทุนจาก DARPA รูปแบบนี้ห่อหุ้มตัวอย่างเสียงดิบด้วยส่วนหัว ASCII ที่มีโครงสร้างซึ่งเข้ารหัสเมตาดาต้า เช่น อัตราสุ่มตัวอย่าง จำนวนแชนเนล ประเภทการเข้ารหัส ข้อมูลประชากรผู้พูด และคำอธิบายการถอดความ — เหมาะอย่างยิ่งสำหรับการเผยแพร่คอร์ปัสเสียงพูด ไฟล์ NIST มักเก็บ PCM แบบไม่บีบอัดหรือเสียง mu-law ที่อัตราสุ่มตัวอย่างคุณภาพโทรศัพท์ (8 kHz หรือ 16 kHz) แม้คอนเทนเนอร์จะยืดหยุ่นพอรองรับการเข้ารหัสหลายแบบ ข้อดีสำคัญคือส่วนหัวแบบบันทึกตัวเองที่หลากหลาย ช่วยให้นักวิจัยฝังเมตาดาต้าคอร์ปัสโดยละเอียดในไฟล์โดยตรง ไม่ต้องมีไฟล์ข้างเคียง SPHERE ยังกลายเป็นมาตรฐานที่ใช้จริงสำหรับฐานข้อมูลเสียงพูดหลัก ๆ เช่น TIMIT, Switchboard และคอร์ปัส Fisher รับประกันการรับรู้อย่างกว้างขวางในห้องปฏิบัติการทั้งด้านวิชาการและภาครัฐ ข้อกำหนดแบบเปิดและเครื่องมือบรรทัดคำสั่งที่มีให้ (sphere, h_strip, w_decode) ทำให้สามารถแปลง ตรวจสอบ และประมวลผลไฟล์เหล่านี้ทางโปรแกรมได้อย่างตรงไปตรงมาในไปป์ไลน์ประมวลผลเสียงพูด
เผยแพร่ครั้งแรก: 1990

คำถามที่พบบ่อย

ทำไมต้องแปลง SPX เป็น NIST?

NIST คือรูปแบบเสียงมาตรฐานสำหรับงานวิจัย speech processing — ใช้โดย National Institute of Standards and Technology ใน evaluation benchmark

รูปแบบ NIST คืออะไร?

ไฟล์ NIST เก็บเสียงพร้อม header มาตรฐานสำหรับงานวิจัยเสียงพูด — ใช้ใน NIST speaker recognition และ language identification evaluation

โปรแกรมอะไรเปิดไฟล์ NIST ได้บ้าง?

NIST SPHERE toolkit, SOX, Kaldi และ Praat รองรับ NIST-format audio โดยตรง

NIST เหมือนกับ SPH ไหม?

มีความเกี่ยวข้องกันใกล้ชิด — ทั้งคู่มาจากมาตรฐาน NIST SPHERE คำทั้งสองมักใช้แทนกันได้ในงานวิจัยเสียงพูด

ฟรีไหม?

ใช่ — การแปลง SPX เป็น NIST ฟรีที่ convertio.cloud