SPXからNISTコンバーター
Speex音声をNIST標準オーディオ形式に再エンコード
spx
nist
標準研究形式
Speex録音をNIST標準に移行 — 話者認識評価と音声ベンチマークに対応しています。
クラウド変換
NIST SPHEREツールキットをローカルにインストールする必要はありません。クラウドサービスを通じてSPXをNISTに直接変換できます。
安全なワークフロー
SPXのアップロードは変換後に削除されます。NIST出力は24時間以内にサーバーから削除されます。
SPXをNISTへ変換する方法
コンピューター、Googleドライブ、Dropbox、URLからファイルを選ぶか、ページにドラッグして下さい.
nistもしくは必要な別のフォーマットを選ぶ(200種類以上のフォーマットが利用できます)
ファイルを変換すれば、すぐにnistファイルをダウンロードできます
フォーマットについて
Speexは、Xiph.Org FoundationのもとでJean-Marc Valinが開発した、音声圧縮に特化したオープンソースオーディオコーデックです。2002年10月に初めてリリースされ、VoIP、会議、およびネットワーク上で効率的に音声を伝送する必要があるあらゆるシナリオをターゲットとしています。SPXファイルはSpeexエンコードされたオーディオをOggコンテナ内にラップし、コーデックの音声最適化とOggのストリーミング機能を組み合わせています。3つのサンプリングレートがサポートされています — 8 kHzのナローバンド、16 kHzのワイドバンド、32 kHzのウルトラワイドバンド — さらに音声の複雑さにリアルタイムで適応する可変ビットレートエンコーディングも搭載しています。際立った利点は、特許フリーのBSDライセンスという性質で、開発者は商用およびオープンソース製品の両方に自由に組み込むことができました。Speexはまた音響エコーキャンセレーション、ノイズ抑制、自動ゲインコントロールをバンドルしており、競合コーデックが通常外部ライブラリに委託する機能です。その開発者は2012年以来、公式に後継としてOpusを推奨していますが、Speexはレガシーなるものの、VoIPシステム、アーカイブされた録音、および軽量なデコーダーフットプリントが依然として価値のある組み込みデバイスで使用され続けています。
NIST SPHERE(SPeech HEader REsources)は、アメリカ国立標準技術研究所がDARPA資金の音声研究プロジェクト向けに作成した特殊なオーディオファイル形式です。この形式は、サンプルレート、チャンネル数、エンコーディングタイプ、話者の属性、書き起こしアノテーションなどのメタデータをエンコードする構造化されたASCIIヘッダーで生のオーディオサンプルをラップし、音声コーパスの配布に最適です。NISTファイルは通常、電話品質のサンプルレート(8 kHzまたは16 kHz)で非圧縮PCMまたはmu-lawオーディオを格納しますが、コンテナはさまざまなエンコーディングを保持できる柔軟性があります。重要な利点は、研究者が詳細なコーパスメタデータをファイルに直接埋め込める豊富な自己文書化ヘッダーで、サイドカーファイルが不要になります。SPHEREはまた、TIMIT、Switchboard、Fisherコーパスなどの主要な音声データベースのデファクトスタンダードとなり、学術および政府の研究室全体で広く認知されています。オープンな仕様とコマンドラインツール(sphere、h_strip、w_decode)の利用可能性により、音声処理パイプラインでのファイルの変換、検査、処理が容易です。
よくある質問
なぜSPXをNISTに変換するのですか?
NISTは音声処理研究の標準オーディオ形式で、評価ベンチマークに米国国立標準技術研究所が使用します。
NIST形式とは何ですか?
NISTファイルは音声研究向けの標準化されたヘッダーでオーディオを格納します — NIST話者認識と言語識別評価で使用されます。
NISTファイルを開くのは何ですか?
NIST SPHEREツールキット、SOX、Kaldi、PraatがNIST形式オーディオをネイティブで処理します。
NISTはSPHと同じですか?
密接に関連しています — 両方ともNIST SPHERE標準に由来します。音声研究ではしばしば互換的に使用されます。
無料ですか?
はい — convertio.cloudでのSPXからNISTへの変換は無料です。