محوّل VOX إلى NIST

ترميز تسجيلات Dialogic VOX بصيغة بيانات الكلام NIST

أسقِط الملفات هنا. 1 GB الحد الأقصى لحجم الملف أو تسجيل
إلى
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

صيغة بيانات الكلام

حوّل VOX إلى NIST — الصيغة المعيارية لمقاييس تعرّف الكلام.

أداة عبر المتصفح

لا أدوات NIST مطلوبة محلياً. التحويل يعمل أونلاين.

خصوصية البيانات

تُحذف الملفات وتُمسح المخرجات تلقائياً خلال 24 ساعة.

كيفية تحويل VOX إلى NIST

1

قُم بتحديد الملفات من جهاز الحاسوب وGoogle Drive وDropbox، ورابط URL أو من خلال سحبها إلى الصفحة.

2

اختر صيغة nist أو أية صيغة أخرى أنت بحاجةٍ إليها كنتيجة (أكثر من 200 صيغة مدعومة)

3

هيا قُم بتحويل الملف وسوف يمكنك تنزيل ملفك بصيغة nist فِيما بعد

عن الصيغ

VOX هو تنسيق صوتي بدون ترويسة مبني على ترميز Dialogic ADPCM، واعتُمد على نطاق واسع في الاتصالات الهاتفية وأنظمة الاستجابة الصوتية التفاعلية (IVR) ومنصات البريد الصوتي منذ الثمانينيات. تُضغط كل عينة صوتية إلى 4 بت باستخدام خوارزمية طوّرتها Oki Electric ونُفّذت في عتاد بطاقات واجهة الاتصالات الهاتفية من Dialogic Corporation. تستخدم ملفات VOX عادةً معدل أخذ عينات 6000 أو 8000 هرتز، مما ينتج تسجيلات مضغوطة للغاية محسّنة لوضوح الكلام بدلاً من دقة الموسيقى. نظراً لعدم وجود ترويسة، يجب على برامج التشغيل معرفة معدل العينة ومعاملات الترميز مسبقاً — مقايضة تقلل الحمل لكنها تتطلب إدارة دقيقة للملفات. المزية الرئيسية لـ VOX هي كفاءة التخزين: تسجيل صوتي مدته دقيقة واحدة عند 8 كيلوهرتز يشغل نحو 240 كيلوبايت فقط، مما يجعله عملياً لأنظمة تخزّن آلاف المطالبات. يتوافق Dialogic ADPCM مع معيار ITU-T G.726، مما يضمن قابلية التشغيل المتبادل عبر معدات الاتصالات من مختلف المصنّعين. حتى مع انتقال مراكز الاتصال الحديثة إلى أنظمة قائمة على IP بمرمّزات مثل Opus، تستمر مكتبات ضخمة من تسجيلات VOX في عمليات نشر IVR القديمة وأرشيفات الامتثال حول العالم.
المطوّر: Dialogic Corporation
الإصدار الأول: 1983
NIST SPHERE (موارد ترويسة الكلام) هو تنسيق ملفات صوتية متخصص ابتكره المعهد الوطني للمعايير والتقنية لأبحاث الكلام، وخاصة المشاريع الممولة من DARPA. يغلّف التنسيق العينات الصوتية الخام بترويسة ASCII منظمة تشفّر بيانات وصفية مثل معدل العينة وعدد القنوات ونوع الترميز والخصائص الديموغرافية للمتحدث والتعليقات التوضيحية للنسخ — مما يجعله مثالياً لتوزيع مدونات الكلام. تخزّن ملفات NIST عادةً صوت PCM غير مضغوط أو mu-law بمعدلات عينة بجودة هاتفية (8 كيلوهرتز أو 16 كيلوهرتز)، رغم أن الحاوية مرنة بما يكفي لاستيعاب ترميزات متنوعة. من أبرز مزاياه الترويسة الغنية ذاتية التوثيق التي تتيح للباحثين تضمين بيانات المدونة الوصفية مباشرة في الملف، مما يلغي الحاجة لملفات مرافقة. أصبح SPHERE أيضاً المعيار الفعلي لـ قواعد بيانات الكلام الرئيسية مثل TIMIT وSwitchboard ومدونة Fisher، مما يضمن اعترافاً واسعاً عبر المختبرات الأكاديمية والحكومية. تسهّل المواصفات المفتوحة وتوفر أدوات سطر الأوامر (sphere وh_strip وw_decode) عمليات التحويل والفحص والمعالجة برمجياً ضمن خطوط أنابيب معالجة الكلام.
الإصدار الأول: 1990

أسئلة مكررة

ما هي NIST؟

NIST صيغة إدخال معيارية لمقاييس تقييم الكلام وأبحاث التعرّف.

لماذا تحويل VOX إلى NIST؟

تسجيلات VOX الهاتفية مادة ممتازة لتدريب نماذج تعرّف الكلام بصيغة NIST المتوافقة.

ما الأدوات التي تستخدم NIST؟

أدوات تقييم NIST وKaldi وHTK ومنصات اللسانيات الحاسوبية.

هل NIST بدون خسارة؟

نعم. NIST تخزّن البيانات بدون ضغط مع خسارة.

هل التحويل آمن؟

تُحذف ملفات VOX فوراً وتُمسح مخرجات NIST خلال 24 ساعة.

VOX إلى NIST تصنيف الجودة

5.0 (1 الأصوات)
تحتاج إلى تحويل وتنزيل ملف واحد على الأقل لتقديم التغذية الراجعة!