محول SLN الى HTK

تصدير صوت Asterisk SLN الى صيغة HTK للتعرف على الكلام

أسقِط الملفات هنا. 1 GB الحد الأقصى لحجم الملف أو تسجيل
إلى
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

مخرجات جاهزة للبحث

حول تسجيلات SLN الهاتفية مباشرة الى صيغة HTK — جاهزة لتجارب التعرف على الكلام والتحليل اللغوي.

من PBX الى البحث

اسد الفجوة بين انظمة Asterisk الهاتفية وابحاث الكلام الاكاديمية بتحويل تسجيلات SLN الى ملفات متوافقة مع HTK.

حماية البيانات

تُعالج تسجيلاتك الهاتفية بخصوصية. جميع الملفات المرفوعة والمحولة تُحذف تلقائيا.

كيفية تحويل SLN إلى HTK

1

قُم بتحديد الملفات من جهاز الحاسوب وGoogle Drive وDropbox، ورابط URL أو من خلال سحبها إلى الصفحة.

2

اختر صيغة htk أو أية صيغة أخرى أنت بحاجةٍ إليها كنتيجة (أكثر من 200 صيغة مدعومة)

3

هيا قُم بتحويل الملف وسوف يمكنك تنزيل ملفك بصيغة htk فِيما بعد

عن الصيغ

SLN (خطي موقّع) هو تنسيق صوتي خام بدون ترويسة يخزّن عينات PCM خطية موقّعة بدقة 16 بت عند 8000 هرتز أحادية، ويرتبط ارتباطاً وثيقاً بـ Asterisk — إطار عمل PBX مفتوح المصدر الذي طوّرته Digium (الآن Sangoma Technologies). ضمن Asterisk، يعمل SLN كتمثيل صوتي داخلي أصلي: تمر كل عملية تحويل ترميز عبر الصيغة الخطية الموقّعة كخطوة وسيطة. هذا يجعل SLN العمود الفقري لبنية تحويل المرمّزات في Asterisk. لا يحتوي التنسيق على أي شيء سوى العينات الخام — لا ترويسات ولا بيانات وصفية ولا تأطير — لذا يجب أن تكون المعاملات معروفة مسبقاً. رغم أن غياب الوصف الذاتي قد يبدو مقيّداً، إلا أنه في الواقع ميزة في الاتصالات الهاتفية حيث يكون تنسيق العينة ثابتاً بالاتفاق وكل بايت زائد مهم عبر آلاف القنوات المتزامنة. يتوافق معدل 8000 هرتز مع معيار G.711 للاتصالات الهاتفية التقليدية، مما يلتقط نطاق الصوت الكامل 300-3400 هرتز. يدعم Asterisk أيضاً متغيرات موسّعة (sln16 وsln32 وsln48) للصوت واسع النطاق. لا تتطلب ملفات SLN أي فك ترميز — مجرد ربط مباشر بالذاكرة — مما يجعلها مثالية للمزج في الوقت الفعلي والمؤتمرات وتشغيل المطالبات في بيئات VoIP عالية الكثافة.
الإصدار الأول: 1999
HTK هو حاوية أشكال موجية أصلية لـ حزمة أدوات نموذج ماركوف المخفي، وهي مجموعة برمجيات طُوّرت في قسم الهندسة بجامعة كامبريدج لأبحاث التعرف على الكلام. وُزّعت لأول مرة عام 1993، وأصبحت HTK سريعاً منصة مرجعية في مختبرات اللسانيات الحاسوبية حول العالم، وتبعها تنسيق الملفات الخاص بها. يخزّن كل ملف تسلسلاً من متجهات المعاملات أو العينات الخام مسبوقاً بترويسة من 12 بايت تحدد عدد الإطارات وفترة الإطار بوحدات 100 نانوثانية وعدد البايتات لكل إطار ورمز نوع يشير إلى طبيعة البيانات — تتراوح الخيارات من PCM للشكل الموجي إلى معاملات MFCC وطاقات مصفاة الترشيح. هذا التنوع يتيح لحاوية واحدة حمل كل من الصوت المصدر والميزات المستخلصة دون تغيير المحللات. تتجنب الترويسة المختصرة عمداً حشو المحاذاة أو الكتل الاختيارية، مما يجعل التنسيق سهل القراءة من C أو Python أو MATLAB ببضعة أسطر من الإدخال/الإخراج الثنائي. ثلاث مزايا تدعم أهمية HTK المستمرة: التكامل الوثيق مع خط أنابيب التدريب والتعرف في HTK، والتخطيط الحتمي للبايتات الذي يزيل غموض التحليل، والاعتماد الواسع في المدونات الأكاديمية.
الإصدار الأول: 1993

أسئلة مكررة

لماذا تحويل SLN الى HTK؟

صيغة HTK تُستخدم بواسطة مجموعة ادوات Hidden Markov Model لابحاث التعرف على الكلام. تحويل SLN يحضّر الصوت الهاتفي للتحليل.

ما الذي يستخدم ملفات HTK؟

مجموعة ادوات HTK للتعرف على الكلام وادوات البحث الاكاديمي واطر معالجة الكلام تعمل مع بيانات HTK.

هل HTK مناسب للتشغيل العام؟

لا — HTK صيغة بحثية مصممة لتجارب التعرف على الكلام وليس لتشغيل الصوت للاستخدام العام.

هل يمكنني تحويل دفعة من الملفات؟

ارفع عدة تسجيلات SLN وحولها جميعا الى HTK في جلسة واحدة — مثالي لتحضير مجموعات بيانات البحث.

هل التحويل آمن؟

تُحذف ملفات SLN بعد المعالجة، وتُزال ملفات HTK الناتجة من الخوادم خلال 24 ساعة.