ตัวแปลง TAK เป็น NIST

เข้ารหัสเสียง TAK เป็นฟอร์แมต NIST Sphere ออนไลน์

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

วิจัยเสียงพูด

ฟอร์แมต NIST เป็นมาตรฐานสำหรับชุดข้อมูลเสียงพูด — แปลงจาก TAK แบบ Lossless เพื่อข้อมูลวิจัยที่สะอาดที่สุด

ต้นฉบับบริสุทธิ์

TAK แบบ Lossless ให้ตัวอย่างเสียงพูดถึง NIST โดยไม่มี artifact ใดๆ จากการบีบอัดก่อนหน้า

ประมวลผลปลอดภัย

ไฟล์ TAK ที่อัปโหลดจะถูกลบทันที ข้อมูล NIST จะถูกลบจากเซิร์ฟเวอร์ภายใน 24 ชั่วโมง

วิธีแปลง TAK เป็น NIST

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ nist หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ nist ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

TAK (Tom's lossless Audio Kompressor) เป็นโคเดกเสียงแบบไม่สูญเสียคุณภาพประสิทธิภาพสูง สร้างโดยนักพัฒนาชาวเยอรมัน Thomas Becker โดยเวอร์ชันสาธารณะแรกเปิดตัวในปี 2007 เดิมชื่อ YALAC โปรเจกต์ถูกเปลี่ยนชื่อก่อนเปิดตัวและได้รับการยอมรับอย่างรวดเร็วในด้านอัตราส่วนการบีบอัดที่เทียบเท่าหรือเหนือกว่า FLAC ในขณะที่ถอดรหัสได้เร็วกว่าอย่างเห็นได้ชัด TAK รองรับเสียง PCM ที่ความลึกสูงสุด 24 บิตและอัตราสุ่มตัวอย่างสูงสุด 192 kHz ครอบคลุมตั้งแต่คุณภาพ CD ไปจนถึงมาสเตอร์สตูดิโอความละเอียดสูง จุดแข็งที่สำคัญที่สุดประการหนึ่งคือความเร็วในการเข้ารหัส — แม้ที่การบีบอัดสูงสุด TAK เข้ารหัสได้เร็วกว่าโคเดกไม่สูญเสียคุณภาพคู่แข่งส่วนใหญ่ที่การตั้งค่าเริ่มต้น ตัวถอดรหัสก็มีประสิทธิภาพเช่นกัน ทำให้การเล่นแบบเรียลไทม์ทำได้ง่ายบนฮาร์ดแวร์ที่ไม่แรง การตรวจจับข้อผิดพลาดผ่าน CRC-32 checksum รับประกันความถูกต้องในระดับบิต สำคัญสำหรับการเก็บถาวร TAK ยังรองรับ embedded cue sheet และแท็ก APEv2 สำหรับการจัดระเบียบอัลบั้มหลายแทร็ก ข้อจำกัดหลักคือ TAK ยังคงเป็นซอร์สปิดและใช้ได้เฉพาะ Windows ซึ่งจำกัดการนำไปใช้ข้ามแพลตฟอร์ม สำหรับผู้ใช้ที่ให้ความสำคัญกับประสิทธิภาพการบีบอัดและความเร็วบนระบบ Windows TAK เป็นหนึ่งในตัวเลือกไม่สูญเสียคุณภาพที่ดีที่สุด
ผู้พัฒนา: Thomas Becker
เผยแพร่ครั้งแรก: 2007
NIST SPHERE (SPeech HEader REsources) เป็นรูปแบบไฟล์เสียงเฉพาะทางที่สร้างโดย สถาบันมาตรฐานและเทคโนโลยีแห่งชาติ สำหรับการวิจัยเสียงพูด โดยเฉพาะโปรเจกต์ที่ได้รับทุนจาก DARPA รูปแบบนี้ห่อหุ้มตัวอย่างเสียงดิบด้วยส่วนหัว ASCII ที่มีโครงสร้างซึ่งเข้ารหัสเมตาดาต้า เช่น อัตราสุ่มตัวอย่าง จำนวนแชนเนล ประเภทการเข้ารหัส ข้อมูลประชากรผู้พูด และคำอธิบายการถอดความ — เหมาะอย่างยิ่งสำหรับการเผยแพร่คอร์ปัสเสียงพูด ไฟล์ NIST มักเก็บ PCM แบบไม่บีบอัดหรือเสียง mu-law ที่อัตราสุ่มตัวอย่างคุณภาพโทรศัพท์ (8 kHz หรือ 16 kHz) แม้คอนเทนเนอร์จะยืดหยุ่นพอรองรับการเข้ารหัสหลายแบบ ข้อดีสำคัญคือส่วนหัวแบบบันทึกตัวเองที่หลากหลาย ช่วยให้นักวิจัยฝังเมตาดาต้าคอร์ปัสโดยละเอียดในไฟล์โดยตรง ไม่ต้องมีไฟล์ข้างเคียง SPHERE ยังกลายเป็นมาตรฐานที่ใช้จริงสำหรับฐานข้อมูลเสียงพูดหลัก ๆ เช่น TIMIT, Switchboard และคอร์ปัส Fisher รับประกันการรับรู้อย่างกว้างขวางในห้องปฏิบัติการทั้งด้านวิชาการและภาครัฐ ข้อกำหนดแบบเปิดและเครื่องมือบรรทัดคำสั่งที่มีให้ (sphere, h_strip, w_decode) ทำให้สามารถแปลง ตรวจสอบ และประมวลผลไฟล์เหล่านี้ทางโปรแกรมได้อย่างตรงไปตรงมาในไปป์ไลน์ประมวลผลเสียงพูด
เผยแพร่ครั้งแรก: 1990

คำถามที่พบบ่อย

NIST คืออะไร?

NIST Sphere เป็นฟอร์แมตเสียงที่ใช้โดย NIST สำหรับชุดข้อมูลเสียงพูดและโปรแกรมประเมินการรู้จำเสียงพูด

ทำไมต้องแปลง TAK เป็น NIST?

เครื่องมือรู้จำเสียงพูดและชุดข้อมูลวิจัยต้องการเสียงฟอร์แมต NIST ต้นฉบับ TAK แบบ Lossless ให้ตัวอย่างเสียงพูดที่สะอาด

อะไรใช้ไฟล์ NIST?

NIST SPHERE utilities, เครื่องมือประเมินเสียงพูด และซอฟต์แวร์วิจัยภาษาศาสตร์ทำงานกับฟอร์แมต NIST

คุณภาพเสียงรักษาไว้หรือไม่?

NIST รองรับเสียง PCM ไม่บีบอัด การแปลงจาก TAK แบบ Lossless รักษาคุณภาพเต็มรูปแบบ

ข้อมูลปลอดภัยหรือไม่?

ไฟล์ TAK ที่อัปโหลดจะถูกลบทันที ผลลัพธ์ NIST จะถูกลบจากเซิร์ฟเวอร์ภายใน 24 ชั่วโมง