SPX to SPH Converter

แปลงเสียง Speex เป็นรูปแบบ NIST SPH speech header

เลือกไฟล์ต่างๆ

วางไฟล์ต่างๆ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ

ไปยัง

รูปแบบ Speech Corpus

แปลงการบันทึก SPX เป็นรูปแบบ NIST SPHERE — มาตรฐานทองสำหรับแจกจ่าย speech research dataset ทั่วโลก

เข้ากันได้กับงานวิจัย

ไฟล์ SPH ใช้งานได้กับ Kaldi, HTK, Praat และ speech processing toolkit หลักทั้งหมดที่ใช้ใน NLP และงานวิจัยเสียง

ความเป็นส่วนตัวของข้อมูล

ไฟล์ SPX ที่อัปโหลดจะถูกลบหลังการแปลง เอาต์พุต SPH จะถูกลบออกจากเซิร์ฟเวอร์ภายใน 24 ชั่วโมง

วิธีแปลง SPX เป็น SPH

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

เลือกรูปแบบไฟล์ sph หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ sph ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

Speex เป็นโคเดกเสียงโอเพนซอร์สที่สร้างขึ้นโดยเฉพาะสำหรับการบีบอัดเสียงพูด พัฒนาโดย Jean-Marc Valin ภายใต้ Xiph.Org Foundation เปิดตัวครั้งแรกในเดือนตุลาคม 2002 โดยมุ่งเป้าไปที่การสื่อสารด้วยเสียงผ่าน IP การประชุมทางเสียง และทุกสถานการณ์ที่ต้องส่งเสียงพูดอย่างมีประสิทธิภาพผ่านเครือข่าย ไฟล์ SPX บรรจุเสียงที่เข้ารหัสด้วย Speex ในคอนเทนเนอร์ Ogg ผสมผสานการปรับแต่งเสียงพูดของโคเดกกับความสามารถในการสตรีมของ Ogg รองรับอัตราสุ่มตัวอย่างสามระดับ — แบนด์แคบที่ 8 kHz แบนด์กว้างที่ 16 kHz และอัลตราแบนด์กว้างที่ 32 kHz — พร้อมการเข้ารหัสบิตเรตแปรผันที่ปรับตัวแบบเรียลไทม์ตามความซับซ้อนของเสียงพูด ข้อดีที่โดดเด่นคือลักษณะที่ปลอดสิทธิบัตรภายใต้สัญญาอนุญาต BSD ซึ่งให้นักพัฒนาฝังไว้ในผลิตภัณฑ์ทั้งเชิงพาณิชย์และโอเพนซอร์สได้อย่างอิสระ Speex ยังรวมการตัดเสียงสะท้อน การระงับเสียงรบกวน และการควบคุมอัตราขยายอัตโนมัติ — ฟีเจอร์ที่โคเดกคู่แข่งมักมอบหมายให้ไลบรารีภายนอก แม้ว่าผู้สร้างจะแนะนำ Opus อย่างเป็นทางการเป็นตัวสืบทอดตั้งแต่ปี 2012 แต่ Speex ยังคงถูกใช้งานในระบบ VoIP เดิม การบันทึกที่เก็บถาวร และอุปกรณ์ฝังตัวที่ตัวถอดรหัสที่ใช้ทรัพยากรน้อยยังคงมีคุณค่า

ผู้พัฒนา: Xiph.Org Foundation

เผยแพร่ครั้งแรก: 15 ตุลาคม 2002

SPH เป็นนามสกุลไฟล์สำหรับเสียงที่จัดเก็บในรูปแบบ NIST SPHERE (SPeech HEader REsources) มาตรฐานที่สร้างโดยสถาบันมาตรฐานและเทคโนโลยีแห่งชาติสหรัฐอเมริการาวปี 1990 สร้างขึ้นสำหรับการวิจัยด้านเสียงพูด ไฟล์ SPH มีส่วนหัว ASCII ขนาด 1024 ไบต์ที่บรรจุเมทาดาทา — ตัวระบุฐานข้อมูล จำนวนช่องสัญญาณ อัตราสุ่มตัวอย่าง ลำดับไบต์ และประเภทการบีบอัด — ทำให้ทุกการบันทึกอธิบายตัวเองได้ เสียงพื้นฐานโดยทั่วไปเป็น PCM เชิงเส้น 16 บิตที่สุ่มตัวอย่าง 16 kHz แม้ว่าจะอนุญาตให้ใช้การกำหนดค่าอื่นได้ นักวิจัยที่ NIST, DARPA และมหาวิทยาลัยทั่วโลกพึ่งพา SPH สำหรับการเผยแพร่คลังเสียงพูดเช่น TIMIT, Switchboard และคอลเลกชัน LDC ที่เป็นรากฐานของระบบการรู้จำเสียงพูดอัตโนมัติสมัยใหม่ ข้อดีสำคัญคือส่วนหัวที่อ่านได้ด้วยมนุษย์ ทำให้สคริปต์สามารถแยกวิเคราะห์เมทาดาทาการบันทึกได้โดยไม่ต้องถอดรหัสไบนารี การกำหนดมาตรฐานที่เข้มงวดของรูปแบบยังขจัดความกำกวมเมื่อแชร์ชุดข้อมูลข้ามสถาบันและแพลตฟอร์ม เนื่องจากไฟล์ SPH จัดเก็บ PCM แบบไม่บีบอัด จึงรักษาความเที่ยงตรงของเสียงอย่างเต็มที่ — สิ่งสำคัญอย่างยิ่งเมื่อฝึกแบบจำลองอะคูสติกที่แม้แต่สิ่งแปลกปลอมเล็กน้อยก็อาจบิดเบือนผลลัพธ์ได้

ผู้พัฒนา: National Institute of Standards and Technology

เผยแพร่ครั้งแรก: 1990

คำถามที่พบบ่อย

ทำไมต้องแปลง SPX เป็น SPH?

SPH (NIST SPHERE) คือรูปแบบมาตรฐานสำหรับ speech research corpus การแปลงจาก SPX เตรียมการบันทึกสำหรับงานวิจัยภาษาศาสตร์และเสียง

NIST SPHERE คืออะไร?

SPHERE (SPeech HEader Resources) พัฒนาโดย NIST สำหรับการแจกจ่ายข้อมูลเสียงพูดมาตรฐานในชุมชนวิจัย

เครื่องมืออะไรใช้งานได้กับ SPH?

NIST SPHERE toolkit, HTK, Kaldi, Praat และ speech processing framework หลักรองรับไฟล์ SPH โดยตรง

SPH ใช้ใน speech recognition ไหม?

ใช่ — speech corpus หลักส่วนใหญ่ (TIMIT, Switchboard เป็นต้น) แจกจ่ายในรูปแบบ SPH สำหรับฝึก recognition model

แปลงฟรีไหม?

ใช่ — ฟรีที่ convertio.cloud สำหรับการใช้งานมาตรฐาน

การแปลงที่เกี่ยวข้อง

SPX เป็น MP3

SPX เป็น WAV

SPX เป็น AAC

SPX เป็น M4A

SPX เป็น OGG

SPX เป็น W64

SPX เป็น OPUS

SPX เป็น OGA

SPX เป็น MP2

SPX เป็น GSM

SPX เป็น FLAC

SPX เป็น DTS

SPX เป็น CAF

SPX เป็น AMR

SPX เป็น AC3

SPX เป็น WMA

SPX เป็น AIFF

SPX เป็น M4R

SPX เป็น WV

SPX เป็น VOC

SPX เป็น TTA

SPX เป็น RA

SPX เป็น PVF

SPX เป็น PRC

SPX เป็น MAUD

SPX เป็น 8SVX

SPX เป็น AMB

SPX เป็น AU

SPX เป็น SND

SPX เป็น SNDR

SPX เป็น SNDT

SPX เป็น AVR

SPX เป็น CDDA

SPX เป็น CVS

SPX เป็น CVSD

SPX เป็น CVU

SPX เป็น DVMS

SPX เป็น VMS

SPX เป็น FAP

SPX เป็น PAF

SPX เป็น FSSD

SPX เป็น SOU

SPX เป็น GSRT

SPX เป็น HCOM

SPX เป็น HTK

SPX เป็น IMA

SPX เป็น IRCAM

SPX เป็น SLN

SPX เป็น SPH

SPX เป็น NIST

SPX เป็น SMP

SPX เป็น TXW

SPX เป็น VOX

SPX เป็น WVE

SPX เป็น SD2

ตัวแปลงเฉพาะ

MP3 เป็น SPH

WAV เป็น SPH

MP4 เป็น SPH

ASF เป็น SPH

FLAC เป็น SPH

M4A เป็น SPH

OGG เป็น SPH

SWF เป็น SPH

WVE เป็น SPH

3G2 เป็น SPH

3GP เป็น SPH

AAF เป็น SPH

AV1 เป็น SPH

AVCHD เป็น SPH

AVI เป็น SPH

CAVS เป็น SPH

DIVX เป็น SPH

DV เป็น SPH

F4V เป็น SPH

FLV เป็น SPH

HEVC เป็น SPH

M2TS เป็น SPH

M2V เป็น SPH

M4V เป็น SPH

MJPEG เป็น SPH

MKV เป็น SPH

MOD เป็น SPH

MOV เป็น SPH

MPEG เป็น SPH

MPEG-2 เป็น SPH