VOC to NIST Converter

将 Sound Blaster VOC 录音保存为 NIST 格式

放置文件在这里. 1 GB 最大文件大小 或者 注册
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

研究集成

NIST 是语音语料库的标准容器,将 VOC 转为 NIST 可将 Sound Blaster 录音集成到研究流水线中。

批量处理

高效构建语音语料库——上传多个 VOC 文件,在一次会话中为所有文件生成 NIST 输出。

私密安全

研究音频通常包含敏感语音数据,上传的 VOC 文件立即删除,NIST 输出在 24 小时内清除。

如何转换VOC到NIST

1

从计算机,Google Drive,Dropbox,URL或在页面上拖拽选择文件.

2

选择nist或任何其他你需要的格式作为结果(支持超过200种格式)

3

让文件进行转换随后你可以下载你的nist文件

关于格式

VOC(Creative Voice)是由创新科技开发的数字音频容器,于 1989 年随初代 Sound Blaster 声卡一同推出。在 DOS 时代,VOC 作为 Sound Blaster 系列的原生音频格式,而创新科技的硬件则主导着 PC 音频领域。VOC 文件基于块结构:每个文件由多个类型化的数据块组成,可承载 8 位无符号 PCM、4 位和 2.6 位 Creative ADPCM、16 位有符号 PCM,以及 A-law 和 mu-law 编码的音频。这种块结构还支持静音间隔、重复循环和标记点,为游戏开发者提供了对声音播放的精细控制。一个显著优势是硬件级别的解码 — Sound Blaster 声卡可以通过 DMA 传输直接播放 VOC 数据,在处理器周期极为宝贵的时代释放了 CPU 资源用于其他任务。该格式在 id Software、Sierra 和 LucasArts 的 DOS 游戏中被广泛使用。随着 Windows 和 WAV 格式的兴起,VOC 逐渐退出了主流,但它对于复古游戏保存以及处理经典 PC 音频存档的工作者来说仍然非常重要。
首次发布: 1989
NIST SPHERE(SPeech HEader REsources,语音头资源)是由美国国家标准与技术研究院专门为语音研究而创建的音频文件格式,尤其适用于 DARPA 资助的项目。该格式使用结构化的 ASCII 头部将原始音频采样数据封装在一起,头部中编码了采样率、声道数、编码类型、说话人信息及转录标注等元数据,非常适合分发语音语料库。NIST 文件通常存储未压缩的 PCM 或 mu-law 音频,采样率为电话级别的 8 kHz 或 16 kHz,但容器格式本身足够灵活,可容纳多种编码方式。一个重要优势在于其丰富的自描述头部,研究人员可以将详细的语料库元数据直接嵌入文件中,无需额外的辅助文件。SPHERE 已成为 TIMIT、Switchboard 和 Fisher 等主要语音数据库的事实标准,在学术和政府实验室中获得广泛认可。其开放的规范以及配套的命令行工具(sphere、h_strip、w_decode)使得在语音处理流水线中转换、检查和处理这些文件十分便捷。
首次发布: 1990

经常问的问题

为什么要将 VOC 转换为 NIST?

NIST 使用元数据标头存储音频,用于语音研究,可将传统音频集成到学术语言学研究工作流中。

什么软件可以打开 NIST?

NIST SPHERE 工具包和 SoX 可读取 NIST 文件。Kaldi 和 HTK 等语音识别框架也原生支持此格式。

NIST 格式与 WAV 有何不同?

NIST 使用基于文本的标头,包含丰富的元数据字段——比 WAV 文件的二进制标头描述性强得多。

Kaldi 中使用 NIST 格式吗?

是的。最流行的语音识别工具包之一 Kaldi 可直接读取 NIST SPHERE 文件用于训练和解码。

可以批量转换多个 VOC 文件吗?

上传所有 VOC 录音,同时将它们转换为 NIST——从多个来源构建语音语料库时非常高效。