ตัวแปลง TTA เป็น NIST

เข้ารหัส True Audio เป็นรูปแบบประเมิน NIST ออนไลน์

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

ข้อมูลประเมิน

NIST เป็นมาตรฐานสำหรับเกณฑ์มาตรฐานเสียงพูด — TTA ไม่สูญเสียให้เสียงคุณภาพสูงสำหรับชุดข้อมูลประเมิน

การบันทึกสะอาด

TTA ไม่สูญเสียรับประกันข้อมูลเสียงพูดเข้ารูปแบบ NIST โดยไม่มี artifact การบีบอัดจากก่อนหน้า

เข้ารหัสออนไลน์

ไม่ต้องใช้ NIST toolkit — เซิร์ฟเวอร์แปลง TTA เป็นรูปแบบ NIST ผ่านเบราว์เซอร์

วิธีแปลง TTA เป็น NIST

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ nist หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ nist ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

TTA (True Audio) เป็นโคเดกบีบอัดเสียงแบบไม่สูญเสียคุณภาพแบบเรียลไทม์ พัฒนาโดย Aleksander Djourik โดยมีจุดกำเนิดย้อนไปถึงช่วงต้นทศวรรษ 2000 รูปแบบนี้สร้างสตรีม PCM ต้นฉบับขึ้นมาใหม่อย่างถูกต้องทุกบิตเมื่อถอดรหัส รับประกันว่าไม่มีรายละเอียดเสียงสูญหายระหว่างการจัดเก็บหรือถ่ายโอน TTA จัดการเสียงคุณภาพ CD มาตรฐานรวมถึงเนื้อหาความละเอียดสูงได้ถึงตัวอย่างจำนวนเต็ม 32 บิต ทำให้เหมาะสำหรับการฟังทั่วไปและการเก็บถาวรระดับมืออาชีพ ความเร็วในการประมวลผลเป็นจุดแข็งที่โดดเด่นของ TTA — โคเดกบรรลุการเข้ารหัสและถอดรหัสที่รวดเร็วโดยไม่ต้องใช้ CPU มาก รักษาความเบาแม้บนฮาร์ดแวร์เก่า โครงสร้างไฟล์รองรับแท็กเมทาดาทา ID3v1, ID3v2 และ APEv2 ดังนั้นข้อมูลแทร็กและภาพอัลบั้มจะเดินทางไปกับเสียง การรองรับฮาร์ดแวร์ปรากฏในเครื่องเล่นพกพาหลายรุ่น ทำให้ TTA มีข้อได้เปรียบในทางปฏิบัติเหนือรูปแบบไม่สูญเสียคุณภาพคู่แข่งบางรูปแบบ การอ้างอิงโอเพนซอร์สเผยแพร่ภายใต้สัญญาอนุญาต GNU GPL ส่งเสริมการนำไปใช้โดยชุมชนและการผสานรวมกับบุคคลที่สาม แม้ว่าโคเดกใหม่อย่าง FLAC จะครองส่วนแบ่งที่ใหญ่กว่าในภูมิทัศน์เสียงแบบไม่สูญเสียคุณภาพ TTA ยังคงรับใช้ผู้ใช้ที่ให้คุณค่ากับความเรียบง่ายและการบีบอัดที่โปร่งใส
ผู้พัฒนา: Aleksander Djourik
เผยแพร่ครั้งแรก: 2003
NIST SPHERE (SPeech HEader REsources) เป็นรูปแบบไฟล์เสียงเฉพาะทางที่สร้างโดย สถาบันมาตรฐานและเทคโนโลยีแห่งชาติ สำหรับการวิจัยเสียงพูด โดยเฉพาะโปรเจกต์ที่ได้รับทุนจาก DARPA รูปแบบนี้ห่อหุ้มตัวอย่างเสียงดิบด้วยส่วนหัว ASCII ที่มีโครงสร้างซึ่งเข้ารหัสเมตาดาต้า เช่น อัตราสุ่มตัวอย่าง จำนวนแชนเนล ประเภทการเข้ารหัส ข้อมูลประชากรผู้พูด และคำอธิบายการถอดความ — เหมาะอย่างยิ่งสำหรับการเผยแพร่คอร์ปัสเสียงพูด ไฟล์ NIST มักเก็บ PCM แบบไม่บีบอัดหรือเสียง mu-law ที่อัตราสุ่มตัวอย่างคุณภาพโทรศัพท์ (8 kHz หรือ 16 kHz) แม้คอนเทนเนอร์จะยืดหยุ่นพอรองรับการเข้ารหัสหลายแบบ ข้อดีสำคัญคือส่วนหัวแบบบันทึกตัวเองที่หลากหลาย ช่วยให้นักวิจัยฝังเมตาดาต้าคอร์ปัสโดยละเอียดในไฟล์โดยตรง ไม่ต้องมีไฟล์ข้างเคียง SPHERE ยังกลายเป็นมาตรฐานที่ใช้จริงสำหรับฐานข้อมูลเสียงพูดหลัก ๆ เช่น TIMIT, Switchboard และคอร์ปัส Fisher รับประกันการรับรู้อย่างกว้างขวางในห้องปฏิบัติการทั้งด้านวิชาการและภาครัฐ ข้อกำหนดแบบเปิดและเครื่องมือบรรทัดคำสั่งที่มีให้ (sphere, h_strip, w_decode) ทำให้สามารถแปลง ตรวจสอบ และประมวลผลไฟล์เหล่านี้ทางโปรแกรมได้อย่างตรงไปตรงมาในไปป์ไลน์ประมวลผลเสียงพูด
เผยแพร่ครั้งแรก: 1990

คำถามที่พบบ่อย

NIST คืออะไร?

NIST เป็นข้อกำหนดเสียงจาก National Institute of Standards and Technology สำหรับเกณฑ์มาตรฐานการประเมินเสียงพูด

ทำไมต้องแปลง TTA เป็น NIST?

เกณฑ์มาตรฐานรู้จำเสียงพูดต้องการเสียงรูปแบบ NIST TTA ไม่สูญเสียให้การบันทึกสะอาดสำหรับการประเมิน

อะไรอ่าน NIST?

Kaldi, HTK, เครื่องมือ NIST และเฟรมเวิร์กรู้จำเสียงพูดประมวลผลเสียง NIST สำหรับฝึกโมเดล

NIST ต่างจาก SPH ไหม?

ใช้ข้อกำหนดเฮดเดอร์ NIST Sphere เดียวกัน — เครื่องมือบางตัวถือว่าใช้แทนกันได้

การแปลงเป็นส่วนตัวไหม?

ไฟล์ TTA จะถูกลบทันที เอาต์พุต NIST จะถูกลบภายใน 24 ชั่วโมง