SLN到SPH转换器
将Asterisk SLN录音准备为SPHERE语音研究格式
sln
sph
语音研究标准
将SLN电话音频转为SPH——NIST和语言学研究界信赖的SPHERE格式。
PBX到语料库
将Asterisk电话录音转为研究就绪的SPH文件,用于语音识别和语音学分析。
安全数据处理
电话录音受到保密处理。SLN文件转换后删除,SPH输出24小时内清除。
如何转换SLN到SPH
从计算机,Google Drive,Dropbox,URL或在页面上拖拽选择文件.
选择sph或任何其他你需要的格式作为结果(支持超过200种格式)
让文件进行转换随后你可以下载你的sph文件
关于格式
SLN(Signed Linear,有符号线性)是一种无头部的原始音频格式,存储 8000 Hz 单声道的 16 位有符号线性 PCM 采样,与 Asterisk 开源 PBX 框架密切相关,该框架由 Digium(现为 Sangoma Technologies)开发。在 Asterisk 内部,SLN 作为原生的内部音频表示:每一次编解码器转码操作都以有符号线性格式作为中间步骤,使 SLN 成为 Asterisk 编解码器转换架构的基石。该格式仅包含原始采样数据 — 没有头部、没有元数据、没有帧结构 — 因此参数必须事先确定。虽然这种缺乏自描述性的特点看似局限,但在电话通信领域反而是优势,因为采样格式由惯例固定,且在同时处理数千个通道时每一个额外的开销字节都至关重要。8000 Hz 的采样率与传统电话通信的 G.711 标准一致,可完整捕获 300-3400 Hz 的语音频段。Asterisk 还支持扩展变体(sln16、sln32、sln48)以处理宽带音频。SLN 文件无需解码 — 直接内存映射即可使用 — 非常适合高密度 VoIP 环境中的实时混音、会议和提示音播放。
SPH 是 NIST SPHERE(SPeech HEader REsources,语音头资源)格式音频文件的扩展名,该标准由美国国家标准与技术研究院于 1990 年前后创建。SPH 文件专为语音研究而设计,包含一个 1024 字节的 ASCII 头部,其中填充了丰富的元数据 — 数据库标识、声道数、采样率、字节序和压缩类型 — 使每条录音都具有自描述性。底层音频通常为 16 kHz 采样的 16 位线性 PCM,但也允许其他配置。NIST、DARPA 及全球各大学的研究人员依赖 SPH 格式分发 TIMIT、Switchboard 和 LDC 语料库等语音数据集,这些数据集是现代自动语音识别系统的基础。一个关键优势是,人类可读的头部使得脚本无需二进制解码即可解析录音元数据。该格式严格的标准化也消除了跨机构、跨平台共享数据集时的歧义。由于 SPH 文件存储未压缩的 PCM,可完整保留音频保真度 — 这在训练声学模型时至关重要,因为即使微小的失真也可能影响结果。
经常问的问题
为什么要将SLN转换为SPH?
SPH(SPHERE)是语言学研究中语音语料库的标准格式。将SLN转为SPH可使电话音频准备好用于分析。
什么工具使用SPH文件?
NIST语音工具、HTK、Kaldi以及语言学研究框架都支持SPHERE格式音频数据。
SPH会添加元数据吗?
是的——SPHERE格式包含丰富的文本头部,用于说话者信息、录音条件和转录引用等元数据。
可以批量转换吗?
上传多个SLN录音,在一次会话中全部转换为SPH——非常适合构建语音研究数据集。
转换安全吗?
SLN文件处理后即被移除,SPH输出24小时内从服务器删除。