CVSDからNISTへのコンバーター
CVSDオーディオをNIST研究用形式に変換
cvsd
nist
標準規格形式
CVSDをNISTに変換 — 米国国立標準技術研究所が規定した音声研究用形式です。
研究対応
NIST形式は音声評価ツールやベンチマークフレームワークと統合できます。
安全な処理
CVSDアップロードは即座に消去。NIST出力は24時間以内に自動削除されます。
CVSDをNISTへ変換する方法
コンピューター、Googleドライブ、Dropbox、URLからファイルを選ぶか、ページにドラッグして下さい.
nistもしくは必要な別のフォーマットを選ぶ(200種類以上のフォーマットが利用できます)
ファイルを変換すれば、すぐにnistファイルをダウンロードできます
フォーマットについて
CVSD(Continuously Variable Slope Delta modulation)は、1970年代にNATOとCCITTによって軍事およびテレフォニー用途に標準化された音声デジタル化方式です。連続するサンプル間の差分を1ビットとしてエンコードします — 現在のサンプルが予測を超えれば1、そうでなければ0 — 一方、音節コンパンディングフィルタが同一ビットの連続を監視してステップサイズを調整します。16から64 kbpsで動作するCVSDは、音声の明瞭性と帯域幅のバランスをとり、セキュア軍事リンクや戦術無線システムのエンコーディングとして選ばれました。ビットストリームは単純なハードウェアでデコードでき、もともと専用の集積回路に組み込まれていました。利点の一つは実装のシンプルさで、エンコーダーとデコーダーは最小限のリソースで済み、低消費電力の組み込みハードウェアでのリアルタイム処理が可能です。ノイズの多い条件下での堅牢性はもう一つの強みで、1ビットのエラーはローカルサンプルにのみ影響し、フレーム全体を破損しません。SoXはソフトウェアでのエンコーディングとデコーディングをサポートしており、軍事アーカイブやビンテージ通信インフラのレガシーCVSD録音を最新システムで扱えます。
NIST SPHERE(SPeech HEader REsources)は、アメリカ国立標準技術研究所がDARPA資金の音声研究プロジェクト向けに作成した特殊なオーディオファイル形式です。この形式は、サンプルレート、チャンネル数、エンコーディングタイプ、話者の属性、書き起こしアノテーションなどのメタデータをエンコードする構造化されたASCIIヘッダーで生のオーディオサンプルをラップし、音声コーパスの配布に最適です。NISTファイルは通常、電話品質のサンプルレート(8 kHzまたは16 kHz)で非圧縮PCMまたはmu-lawオーディオを格納しますが、コンテナはさまざまなエンコーディングを保持できる柔軟性があります。重要な利点は、研究者が詳細なコーパスメタデータをファイルに直接埋め込める豊富な自己文書化ヘッダーで、サイドカーファイルが不要になります。SPHEREはまた、TIMIT、Switchboard、Fisherコーパスなどの主要な音声データベースのデファクトスタンダードとなり、学術および政府の研究室全体で広く認知されています。オープンな仕様とコマンドラインツール(sphere、h_strip、w_decode)の利用可能性により、音声処理パイプラインでのファイルの変換、検査、処理が容易です。
よくある質問
NIST形式とは?
NISTは米国国立標準技術研究所が音声評価・研究に使用するオーディオ形式です。
なぜCVSDをNISTに変換するのですか?
NIST形式の入力を必要とする音声評価タスクや研究ワークフロー向けです。
NISTを読み込むソフトは?
SOX、NISTスコアリングツール、HTKやKaldiなどの音声認識フレームワークがサポートしています。
品質に影響しますか?
NISTはPCMオーディオを保持。CVSDの元のデータは忠実に変換されます。
変換は安全ですか?
CVSDアップロードは変換後に削除。NIST出力は24時間以内にサーバーから消去されます。
処理速度は?
コンパクトな形式のため、変換は数秒で完了します。