VOC to SPH Converter
将 Sound Blaster VOC 转换为 NIST SPHERE 格式
voc
sph
语料库标准
NIST SPHERE 是语音研究数据的黄金标准,您的 VOC 录音将进入全球研究人员信任的格式。
VOC 到 SPHERE
连接复古 Sound Blaster 录音与现代语音科学——非常适合从传统音频构建自定义研究语料库。
高效处理
SPHERE 编码简单直接,VOC 到 SPH 的转换快速完成,随时可用于您的研究流水线。
如何转换VOC到SPH
从计算机,Google Drive,Dropbox,URL或在页面上拖拽选择文件.
选择sph或任何其他你需要的格式作为结果(支持超过200种格式)
让文件进行转换随后你可以下载你的sph文件
关于格式
VOC(Creative Voice)是由创新科技开发的数字音频容器,于 1989 年随初代 Sound Blaster 声卡一同推出。在 DOS 时代,VOC 作为 Sound Blaster 系列的原生音频格式,而创新科技的硬件则主导着 PC 音频领域。VOC 文件基于块结构:每个文件由多个类型化的数据块组成,可承载 8 位无符号 PCM、4 位和 2.6 位 Creative ADPCM、16 位有符号 PCM,以及 A-law 和 mu-law 编码的音频。这种块结构还支持静音间隔、重复循环和标记点,为游戏开发者提供了对声音播放的精细控制。一个显著优势是硬件级别的解码 — Sound Blaster 声卡可以通过 DMA 传输直接播放 VOC 数据,在处理器周期极为宝贵的时代释放了 CPU 资源用于其他任务。该格式在 id Software、Sierra 和 LucasArts 的 DOS 游戏中被广泛使用。随着 Windows 和 WAV 格式的兴起,VOC 逐渐退出了主流,但它对于复古游戏保存以及处理经典 PC 音频存档的工作者来说仍然非常重要。
SPH 是 NIST SPHERE(SPeech HEader REsources,语音头资源)格式音频文件的扩展名,该标准由美国国家标准与技术研究院于 1990 年前后创建。SPH 文件专为语音研究而设计,包含一个 1024 字节的 ASCII 头部,其中填充了丰富的元数据 — 数据库标识、声道数、采样率、字节序和压缩类型 — 使每条录音都具有自描述性。底层音频通常为 16 kHz 采样的 16 位线性 PCM,但也允许其他配置。NIST、DARPA 及全球各大学的研究人员依赖 SPH 格式分发 TIMIT、Switchboard 和 LDC 语料库等语音数据集,这些数据集是现代自动语音识别系统的基础。一个关键优势是,人类可读的头部使得脚本无需二进制解码即可解析录音元数据。该格式严格的标准化也消除了跨机构、跨平台共享数据集时的歧义。由于 SPH 文件存储未压缩的 PCM,可完整保留音频保真度 — 这在训练声学模型时至关重要,因为即使微小的失真也可能影响结果。
经常问的问题
为什么要将 VOC 转换为 SPH?
SPHERE 是 NIST 语音语料库的标准音频格式,将 VOC 转为 SPH 可为学术语音研究数据集准备音频。
什么软件可以打开 SPH?
NIST SPHERE 工具包、SoX 和 HTK 可读取 SPH 文件,语音研究人员和语言学家将 SPHERE 作为标准语料库格式使用。
NIST SPHERE 是什么?
SPHERE(SPeech HEader REsources)是 NIST 的音频格式,用于分发带有丰富元数据标头的语音研究语料库。
SPH 与 NIST 是同一格式吗?
SPH 和 NIST 指的是同一个 SPHERE 格式,SPH 是扩展名,NIST 描述的是创建机构。
可以正常播放 SPH 文件吗?
大多数媒体播放器无法打开 SPH,可使用 SoX 转换为 WAV 进行播放,或使用 NIST SPHERE 工具直接访问。