ตัวแปลง GSM เป็น NIST

เข้ารหัสเสียงโทรศัพท์ GSM เป็นรูปแบบเสียงพูด NIST ออนไลน์

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

รูปแบบระดับงานวิจัย

เตรียมบันทึกเสียงโทรศัพท์ GSM สำหรับงานวิจัยเสียงพูดโดยแปลงเป็นรูปแบบ NIST ที่เครื่องมือวิเคราะห์ทางวิชาการต้องการ

ไม่ต้องติดตั้งเครื่องมือ

ไม่ต้องตั้งค่าเครื่องมือ SPHERE บนเครื่อง แปลง GSM เป็น NIST ออนไลน์ผ่านเว็บเบราว์เซอร์ของคุณ

ประมวลผลอย่างเป็นส่วนตัว

ไฟล์ GSM ที่อัปโหลดจะถูกลบหลังแปลง ไฟล์ NIST จะถูกล้างจากเซิร์ฟเวอร์ภายใน 24 ชั่วโมงโดยอัตโนมัติ

วิธีแปลง GSM เป็น NIST

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ nist หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ nist ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

GSM 06.10 (Full Rate) เป็นตัวแปลงสัญญาณเสียงพูดพื้นฐานของมาตรฐาน Global System for Mobile Communications ได้รับการรับรองโดย ETSI ในปี 1991 และใช้งานในเครือข่ายเซลลูลาร์หลายร้อยแห่งทั่วโลก ทำงานที่อัตราคงที่ 13 kbit/s อัลกอริทึมใช้ Regular Pulse Excitation with Long-Term Prediction (RPE-LTP) เพื่อบีบอัดเฟรมเสียงพูดขนาด 20 ms ที่ 8 kHz โมโนเหลือเพียง 33 ไบต์ต่อเฟรม วิธีนี้สร้างแบบจำลองช่องเสียงเป็น linear predictive filter เข้ารหัสสัญญาณกระตุ้น และใช้ประโยชน์จากคาบพิทช์เพื่อลดขนาดเพิ่มเติม — ปรับให้ส่งเสียงพูดที่ชัดเจนภายใต้ข้อจำกัดแบนด์วิดท์ของช่องสัญญาณมือถือดิจิทัลยุคแรก ตัวแปลงสัญญาณนี้ขับเคลื่อนไม่เพียงระบบโทรศัพท์ GSM เท่านั้น แต่ยังรวมถึงแอปพลิเคชัน VoIP ระบบวอยซ์เมล และแพลตฟอร์ม IVR จำนวนมากที่ได้ประโยชน์จากบิตเรตต่ำ ข้อดีที่โดดเด่นสามประการ ประการแรก การบีบอัดที่เหนือชั้น: เสียงพูดหนึ่งนาทีใช้พื้นที่เพียงประมาณ 100 KB ทำให้จัดเก็บและส่งข้อมูลได้อย่างมีประสิทธิภาพ ประการที่สอง เครื่องมือที่ใช้ได้ทั่วไป — ไลบรารีอย่าง libgsm และ SoX จัดการการเข้ารหัสและถอดรหัสบนทุกแพลตฟอร์มหลัก ประการที่สาม สิทธิบัตรที่ไม่มีค่าลิขสิทธิ์ซึ่งส่งเสริมการนำไปใช้ในโปรเจกต์โทรศัพท์โอเพนซอร์สอย่าง Asterisk และ FreeSWITCH
เผยแพร่ครั้งแรก: 1991
NIST SPHERE (SPeech HEader REsources) เป็นรูปแบบไฟล์เสียงเฉพาะทางที่สร้างโดย สถาบันมาตรฐานและเทคโนโลยีแห่งชาติ สำหรับการวิจัยเสียงพูด โดยเฉพาะโปรเจกต์ที่ได้รับทุนจาก DARPA รูปแบบนี้ห่อหุ้มตัวอย่างเสียงดิบด้วยส่วนหัว ASCII ที่มีโครงสร้างซึ่งเข้ารหัสเมตาดาต้า เช่น อัตราสุ่มตัวอย่าง จำนวนแชนเนล ประเภทการเข้ารหัส ข้อมูลประชากรผู้พูด และคำอธิบายการถอดความ — เหมาะอย่างยิ่งสำหรับการเผยแพร่คอร์ปัสเสียงพูด ไฟล์ NIST มักเก็บ PCM แบบไม่บีบอัดหรือเสียง mu-law ที่อัตราสุ่มตัวอย่างคุณภาพโทรศัพท์ (8 kHz หรือ 16 kHz) แม้คอนเทนเนอร์จะยืดหยุ่นพอรองรับการเข้ารหัสหลายแบบ ข้อดีสำคัญคือส่วนหัวแบบบันทึกตัวเองที่หลากหลาย ช่วยให้นักวิจัยฝังเมตาดาต้าคอร์ปัสโดยละเอียดในไฟล์โดยตรง ไม่ต้องมีไฟล์ข้างเคียง SPHERE ยังกลายเป็นมาตรฐานที่ใช้จริงสำหรับฐานข้อมูลเสียงพูดหลัก ๆ เช่น TIMIT, Switchboard และคอร์ปัส Fisher รับประกันการรับรู้อย่างกว้างขวางในห้องปฏิบัติการทั้งด้านวิชาการและภาครัฐ ข้อกำหนดแบบเปิดและเครื่องมือบรรทัดคำสั่งที่มีให้ (sphere, h_strip, w_decode) ทำให้สามารถแปลง ตรวจสอบ และประมวลผลไฟล์เหล่านี้ทางโปรแกรมได้อย่างตรงไปตรงมาในไปป์ไลน์ประมวลผลเสียงพูด
เผยแพร่ครั้งแรก: 1990

คำถามที่พบบ่อย

รูปแบบ NIST คืออะไร?

NIST เป็นรูปแบบข้อมูลเสียงพูดจาก National Institute of Standards and Technology ใช้กันอย่างแพร่หลายในงานวิจัยเสียงพูดและการเปรียบเทียบประสิทธิภาพ

ทำไมต้องแปลง GSM เป็น NIST?

รูปแบบ NIST เป็นมาตรฐานที่ใช้ในเครื่องมือวิจัยการรู้จำเสียง คลังข้อมูลวิชาการ และเครื่องมือวิเคราะห์เสียงพูดจากระบบโทรศัพท์

NIST แตกต่างจาก SPH อย่างไร?

NIST และ SPH ต่างอยู่ในกลุ่มรูปแบบ SPHERE เป็นมาตรฐานเดียวกันที่ใช้สำหรับงานวิจัยเสียงพูด

เครื่องมือวิจัยอะไรที่อ่านไฟล์ NIST ได้?

Kaldi, HTK, Praat และ NIST SPHERE toolkit ล้วนรองรับไฟล์ NIST สำหรับการวิเคราะห์เสียงพูด

การแปลงเป็นความลับไหม?

ไฟล์ GSM ที่อัปโหลดจะถูกลบหลังแปลง ไฟล์ NIST ที่ได้จะถูกลบจากเซิร์ฟเวอร์ของเราภายใน 24 ชั่วโมง