ตัวแปลง CDDA เป็น NIST

แปลงเสียง CD เป็นรูปแบบ NIST Sphere ออนไลน์

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

มาตรฐานเชิงวิชาการ

แปลง CDDA เป็น NIST Sphere — รูปแบบที่นักวิจัยเสียงพูดทั่วโลกใช้เผยแพร่และแลกเปลี่ยนชุดข้อมูลเสียง

เมตาดาต้าสมบูรณ์

NIST Sphere มีเฮดเดอร์ข้อความสำหรับเมตาดาต้า — แซมเปิลเรต ช่องสัญญาณ การเข้ารหัส และคำอธิบายประกอบสำหรับงานวิจัย

เครื่องมือบนเว็บ

ไม่ต้องติดตั้ง Kaldi, HTK หรือเครื่องมือ NIST แปลง CDDA เป็น NIST ได้โดยตรงในเบราว์เซอร์จากทุกแพลตฟอร์ม

วิธีแปลง CDDA เป็น NIST

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ nist หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ nist ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

CDDA (Compact Disc Digital Audio) หรือที่รู้จักกันในชื่อมาตรฐาน Red Book กำหนดรูปแบบเสียงที่จัดเก็บในซีดีเพลง พัฒนาร่วมกันโดย Sony และ Philips และเผยแพร่ในปี 1980 มาตรฐานนี้กำหนดพารามิเตอร์ที่กำหนดทิศทางเสียงดิจิทัลมาหลายทศวรรษ: linear PCM 16 บิตที่ 44.1 kHz สเตอริโอ ให้อัตราบิต 1,411.2 kbps แบบไม่บีบอัด แต่ละแผ่นบรรจุได้สูงสุด 80 นาที จัดเรียงเป็นแทร็กพร้อมจุดดัชนี ข้อมูลซับแชนเนลสำหรับแสดงข้อความ และรหัสแก้ไขข้อผิดพลาด (CIRC) ที่รับประกันการเล่นที่เสถียรแม้มีรอยขีดข่วนเล็กน้อย เมื่อริปเสียงจากซีดี สตรีมที่ได้มักถูกบันทึกด้วยนามสกุล .cdda เป็น raw PCM ก่อนการแปลง ข้อดีที่ชัดเจนที่สุดคือธรรมชาติแบบไม่บีบอัดและไม่สูญเสียข้อมูล — สิ่งที่เข้าถึงหูของคุณเหมือนกับต้นฉบับจากสตูดิโอทุกประการที่ความละเอียดที่กำหนด การแก้ไขข้อผิดพลาดที่แข็งแกร่งให้ความทนทานยอดเยี่ยม รักษาความสมบูรณ์ของเสียงแม้พื้นผิวแผ่นจะสึกหรอปานกลาง จากการขายหลายพันล้านชิ้นนับตั้งแต่เปิดตัวเชิงพาณิชย์ครั้งแรกในปี 1982 CDDA ได้สร้างมาตรฐานคุณภาพพื้นฐานสำหรับเพลงดิจิทัลและยังคงเป็นเกณฑ์อ้างอิงสำหรับการเปรียบเทียบตัวแปลงสัญญาณแบบบีบอัด
ผู้พัฒนา: Sony / Philips
เผยแพร่ครั้งแรก: ตุลาคม 1980
NIST SPHERE (SPeech HEader REsources) เป็นรูปแบบไฟล์เสียงเฉพาะทางที่สร้างโดย สถาบันมาตรฐานและเทคโนโลยีแห่งชาติ สำหรับการวิจัยเสียงพูด โดยเฉพาะโปรเจกต์ที่ได้รับทุนจาก DARPA รูปแบบนี้ห่อหุ้มตัวอย่างเสียงดิบด้วยส่วนหัว ASCII ที่มีโครงสร้างซึ่งเข้ารหัสเมตาดาต้า เช่น อัตราสุ่มตัวอย่าง จำนวนแชนเนล ประเภทการเข้ารหัส ข้อมูลประชากรผู้พูด และคำอธิบายการถอดความ — เหมาะอย่างยิ่งสำหรับการเผยแพร่คอร์ปัสเสียงพูด ไฟล์ NIST มักเก็บ PCM แบบไม่บีบอัดหรือเสียง mu-law ที่อัตราสุ่มตัวอย่างคุณภาพโทรศัพท์ (8 kHz หรือ 16 kHz) แม้คอนเทนเนอร์จะยืดหยุ่นพอรองรับการเข้ารหัสหลายแบบ ข้อดีสำคัญคือส่วนหัวแบบบันทึกตัวเองที่หลากหลาย ช่วยให้นักวิจัยฝังเมตาดาต้าคอร์ปัสโดยละเอียดในไฟล์โดยตรง ไม่ต้องมีไฟล์ข้างเคียง SPHERE ยังกลายเป็นมาตรฐานที่ใช้จริงสำหรับฐานข้อมูลเสียงพูดหลัก ๆ เช่น TIMIT, Switchboard และคอร์ปัส Fisher รับประกันการรับรู้อย่างกว้างขวางในห้องปฏิบัติการทั้งด้านวิชาการและภาครัฐ ข้อกำหนดแบบเปิดและเครื่องมือบรรทัดคำสั่งที่มีให้ (sphere, h_strip, w_decode) ทำให้สามารถแปลง ตรวจสอบ และประมวลผลไฟล์เหล่านี้ทางโปรแกรมได้อย่างตรงไปตรงมาในไปป์ไลน์ประมวลผลเสียงพูด
เผยแพร่ครั้งแรก: 1990

คำถามที่พบบ่อย

ทำไมต้องแปลง CDDA เป็น NIST?

NIST Sphere เป็นรูปแบบมาตรฐานสำหรับคลังเสียงพูดในงานวิจัยเชิงวิชาการ การแปลง CDDA ทำให้เสียงใช้งานได้ในระบบประมวลผลเสียงพูด

NIST กับ SPH เหมือนกันไหม?

ใช่ — NIST และ SPH ทั้งคู่หมายถึงรูปแบบ NIST Sphere ไฟล์อาจใช้นามสกุล .nist หรือ .sph ขึ้นอยู่กับข้อตกลง

เครื่องมือใดรองรับ NIST?

SoX, Kaldi, HTK และเครื่องมือ Sphere ของ NIST เองอ่านรูปแบบ NIST ได้ เฟรมเวิร์กวิจัยเสียงพูดส่วนใหญ่รองรับโดยตรง

NIST เก็บคุณภาพ CD ได้ไหม?

รูปแบบรองรับได้ แม้งานวิจัยเสียงพูดมักใช้แซมเปิลเรตต่ำกว่า NIST รองรับ 44.1 kHz สำหรับความเที่ยงตรง CDDA เต็มที่เมื่อต้องการ

แปลงจำนวนมากได้ไหม?

อัปโหลดแทร็ก CDDA หลายไฟล์แล้วแปลงเป็น NIST ทั้งหมดพร้อมกัน — สร้างชุดข้อมูลวิจัยจากการบันทึก CD อย่างมีประสิทธิภาพ