SLN到HTK转换器

将Asterisk SLN音频导出为HTK语音识别格式

放置文件在这里. 1 GB 最大文件大小 或者 注册
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

研究就绪输出

将SLN电话录音直接转换为HTK格式——可立即用于语音识别实验和语言学分析。

PBX到研究

连接Asterisk电话系统和学术语音研究,将SLN录音转换为HTK兼容文件。

数据保护

您的电话录音被私密处理。所有上传和转换的文件自动删除。

如何转换SLN到HTK

1

从计算机,Google Drive,Dropbox,URL或在页面上拖拽选择文件.

2

选择htk或任何其他你需要的格式作为结果(支持超过200种格式)

3

让文件进行转换随后你可以下载你的htk文件

关于格式

SLN(Signed Linear,有符号线性)是一种无头部的原始音频格式,存储 8000 Hz 单声道的 16 位有符号线性 PCM 采样,与 Asterisk 开源 PBX 框架密切相关,该框架由 Digium(现为 Sangoma Technologies)开发。在 Asterisk 内部,SLN 作为原生的内部音频表示:每一次编解码器转码操作都以有符号线性格式作为中间步骤,使 SLN 成为 Asterisk 编解码器转换架构的基石。该格式仅包含原始采样数据 — 没有头部、没有元数据、没有帧结构 — 因此参数必须事先确定。虽然这种缺乏自描述性的特点看似局限,但在电话通信领域反而是优势,因为采样格式由惯例固定,且在同时处理数千个通道时每一个额外的开销字节都至关重要。8000 Hz 的采样率与传统电话通信的 G.711 标准一致,可完整捕获 300-3400 Hz 的语音频段。Asterisk 还支持扩展变体(sln16、sln32、sln48)以处理宽带音频。SLN 文件无需解码 — 直接内存映射即可使用 — 非常适合高密度 VoIP 环境中的实时混音、会议和提示音播放。
首次发布: 1999
HTK是隐马尔可夫模型工具包(Hidden Markov Model Toolkit)的原生波形容器,该软件套件由剑桥大学工程系开发,用于语音识别研究。HTK自1993年首次发布以来,迅速成为全球计算语言学实验室的参考平台,其文件格式也随之被广泛采用。每个文件存储一系列参数向量或原始采样,前缀为12字节的头部,指定帧数、以100纳秒为单位的帧周期、每帧字节数以及标识数据类型的类型代码——选项从波形PCM到梅尔频率倒谱系数和滤波器组能量不等。这种灵活性使单一容器既能承载源音频,也能承载提取的特征,无需更换解析器。刻意精简的头部避免了对齐填充或可选块,使得用C、Python或MATLAB仅需几行二进制I/O代码即可轻松读取。HTK持久影响力背后的三大优势是:与HTK训练和识别流水线的紧密集成、消除解析器歧义的确定性字节布局,以及在学术语料库中的广泛采用。
首次发布: 1993

经常问的问题

为什么要将SLN转换为HTK?

HTK格式供隐马尔可夫模型工具包用于语音识别研究。将SLN转为HTK可为分析准备电话音频。

什么工具使用HTK文件?

HTK语音识别工具包、学术研究工具和语音分析框架都支持HTK格式数据。

HTK适合通用播放吗?

不适合——HTK是为语音识别实验设计的研究格式,不适用于通用音频播放。

可以批量转换文件吗?

上传多个SLN录音,在一个会话中全部转换为HTK——非常适合准备研究数据集。

转换安全吗?

SLN文件处理后即被删除,HTK输出文件24小时内从服务器清除。