VOC to SPH Converter

แปลง Sound Blaster VOC เป็นรูปแบบ NIST SPHERE

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

มาตรฐาน Corpus

NIST SPHERE คือมาตรฐานทองสำหรับข้อมูลวิจัยเสียงพูด การบันทึก VOC ของคุณเข้าสู่รูปแบบที่นักวิจัยทั่วโลกไว้วางใจ

VOC สู่ SPHERE

เชื่อมการบันทึก Sound Blaster ย้อนยุคกับวิทยาศาสตร์เสียงพูดสมัยใหม่ เหมาะสำหรับสร้าง research corpus เฉพาะตัวจาก legacy audio

กระบวนการที่มีประสิทธิภาพ

การเข้ารหัส SPHERE ตรงไปตรงมา การแปลง VOC เป็น SPH ของคุณเสร็จรวดเร็ว พร้อมสำหรับ research pipeline

วิธีแปลง VOC เป็น SPH

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ sph หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ sph ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

VOC (Creative Voice) เป็นคอนเทนเนอร์เสียงดิจิทัลที่พัฒนาโดย Creative Technology และเปิดตัวพร้อมกับการ์ด Sound Blaster ดั้งเดิมในปี 1989 ทำหน้าที่เป็นรูปแบบเสียงดั้งเดิมของตระกูล Sound Blaster ในยุค DOS เมื่อฮาร์ดแวร์ของ Creative ครองตลาดเสียง PC ไฟล์ VOC ใช้โครงสร้างแบบบล็อก — แต่ละไฟล์ประกอบด้วยบล็อกข้อมูลที่มีประเภทกำหนด สามารถบรรจุ PCM แบบ 8 บิตไม่มีเครื่องหมาย, Creative ADPCM 4 บิตและ 2.6 บิต, PCM แบบ 16 บิตมีเครื่องหมาย รวมถึงเสียงที่เข้ารหัส A-law และ mu-law โครงสร้างบล็อกนี้ยังรองรับช่วงเงียบ ลูปซ้ำ และจุดมาร์กเกอร์ ให้นักพัฒนาเกมควบคุมการเล่นเสียงได้อย่างละเอียด ข้อดีที่สำคัญคือการถอดรหัสในระดับฮาร์ดแวร์ — การ์ด Sound Blaster สามารถเล่นข้อมูล VOC โดยตรงผ่านการถ่ายโอน DMA ปลดปล่อย CPU สำหรับงานอื่นในยุคที่รอบการประมวลผลมีค่ามาก รูปแบบนี้ถูกใช้อย่างกว้างขวางในเกม DOS จาก id Software, Sierra และ LucasArts เมื่อ Windows และรูปแบบ WAV เริ่มแพร่หลาย VOC ก็ค่อยๆ หายไปจากกระแสหลัก แต่ยังคงมีความสำคัญสำหรับการอนุรักษ์เกมย้อนยุคและผู้ที่ทำงานกับคลังเสียง PC ย้อนยุค
ผู้พัฒนา: Creative Technology
เผยแพร่ครั้งแรก: 1989
SPH เป็นนามสกุลไฟล์สำหรับเสียงที่จัดเก็บในรูปแบบ NIST SPHERE (SPeech HEader REsources) มาตรฐานที่สร้างโดยสถาบันมาตรฐานและเทคโนโลยีแห่งชาติสหรัฐอเมริการาวปี 1990 สร้างขึ้นสำหรับการวิจัยด้านเสียงพูด ไฟล์ SPH มีส่วนหัว ASCII ขนาด 1024 ไบต์ที่บรรจุเมทาดาทา — ตัวระบุฐานข้อมูล จำนวนช่องสัญญาณ อัตราสุ่มตัวอย่าง ลำดับไบต์ และประเภทการบีบอัด — ทำให้ทุกการบันทึกอธิบายตัวเองได้ เสียงพื้นฐานโดยทั่วไปเป็น PCM เชิงเส้น 16 บิตที่สุ่มตัวอย่าง 16 kHz แม้ว่าจะอนุญาตให้ใช้การกำหนดค่าอื่นได้ นักวิจัยที่ NIST, DARPA และมหาวิทยาลัยทั่วโลกพึ่งพา SPH สำหรับการเผยแพร่คลังเสียงพูดเช่น TIMIT, Switchboard และคอลเลกชัน LDC ที่เป็นรากฐานของระบบการรู้จำเสียงพูดอัตโนมัติสมัยใหม่ ข้อดีสำคัญคือส่วนหัวที่อ่านได้ด้วยมนุษย์ ทำให้สคริปต์สามารถแยกวิเคราะห์เมทาดาทาการบันทึกได้โดยไม่ต้องถอดรหัสไบนารี การกำหนดมาตรฐานที่เข้มงวดของรูปแบบยังขจัดความกำกวมเมื่อแชร์ชุดข้อมูลข้ามสถาบันและแพลตฟอร์ม เนื่องจากไฟล์ SPH จัดเก็บ PCM แบบไม่บีบอัด จึงรักษาความเที่ยงตรงของเสียงอย่างเต็มที่ — สิ่งสำคัญอย่างยิ่งเมื่อฝึกแบบจำลองอะคูสติกที่แม้แต่สิ่งแปลกปลอมเล็กน้อยก็อาจบิดเบือนผลลัพธ์ได้
เผยแพร่ครั้งแรก: 1990

คำถามที่พบบ่อย

ทำไมต้องแปลง VOC เป็น SPH?

SPHERE คือรูปแบบเสียงมาตรฐานสำหรับ NIST speech corpus การแปลง VOC เป็น SPH เตรียมเสียงสำหรับชุดข้อมูลวิจัยเสียงพูดเชิงวิชาการ

เปิดไฟล์ SPH ด้วยโปรแกรมอะไรได้บ้าง?

NIST SPHERE toolkit, SoX และ HTK อ่านไฟล์ SPH นักวิจัยเสียงพูดและนักภาษาศาสตร์ใช้ SPHERE เป็นรูปแบบ corpus มาตรฐาน

NIST SPHERE คืออะไร?

SPHERE (SPeech HEader REsources) คือรูปแบบเสียง NIST สำหรับแจกจ่าย speech research corpus พร้อม header metadata สมบูรณ์

SPH เหมือนกับ NIST ไหม?

SPH และ NIST หมายถึงรูปแบบ SPHERE เดียวกัน SPH คือนามสกุล NIST อธิบายองค์กรต้นกำเนิด

เล่นไฟล์ SPH ตามปกติได้ไหม?

เครื่องเล่นสื่อส่วนใหญ่ไม่เปิด SPH ใช้ SoX แปลงเป็น WAV สำหรับการเล่น หรือใช้เครื่องมือ NIST SPHERE สำหรับการเข้าถึงโดยตรง