NIST から SPX へのコンバーター

NISTの音声データをSPX形式に簡単変換

ここにファイルをドロップする. 1 GB ファイルサイズの最大限度 または サインアップ

設定

Speexの全体的な出力オーディオビットレートを設定します。人間の音声のエンコーディング用に設計されたSpeexは、超低ビットレートで透明度を実現し、最大ビットレートは44 kbpsです。
オーディオチャンネル数を設定します。この設定は、チャンネルをダウンミックスするとき(例えば、5.1からステレオへ)に最も便利です。
オーディオのサンプルレートを設定します。フルスペクトル(20 Hz~20 kHz)の音楽では、透明度を得るために44.1 kHzより大きな値が必要です。詳細は ウィキ をご参照ください。

nist

NIST SPHERE(SPeech HEader REsources)は、アメリカ国立標準技術研究所がDARPA資金の音声研究プロジェクト向けに作成した特殊なオーディオファイル形式です。この形式は、サンプルレート、チャンネル数、エンコーディングタイプ、話者の属性、書き起こしアノテーションなどのメタデータをエンコードする構造化されたASCIIヘッダーで生のオーディオサンプルをラップし、音声コーパスの配布に最適です。NISTファイルは通常、電話品質のサンプルレート(8 kHzまたは16 kHz)で非圧縮PCMまたはmu-lawオーディオを格納しますが、コンテナはさまざまなエンコーディングを保持できる柔軟性があります。重要な利点は、研究者が詳細なコーパスメタデータをファイルに直接埋め込める豊富な自己文書化ヘッダーで、サイドカーファイルが不要になります。SPHEREはまた、TIMIT、Switchboard、Fisherコーパスなどの主要な音声データベースのデファクトスタンダードとなり、学術および政府の研究室全体で広く認知されています。オープンな仕様とコマンドラインツール(sphere、h_strip、w_decode)の利用可能性により、音声処理パイプラインでのファイルの変換、検査、処理が容易です。
続きを読む

spx

Speexは、Xiph.Org FoundationのもとでJean-Marc Valinが開発した、音声圧縮に特化したオープンソースオーディオコーデックです。2002年10月に初めてリリースされ、VoIP、会議、およびネットワーク上で効率的に音声を伝送する必要があるあらゆるシナリオをターゲットとしています。SPXファイルはSpeexエンコードされたオーディオをOggコンテナ内にラップし、コーデックの音声最適化とOggのストリーミング機能を組み合わせています。3つのサンプリングレートがサポートされています — 8 kHzのナローバンド、16 kHzのワイドバンド、32 kHzのウルトラワイドバンド — さらに音声の複雑さにリアルタイムで適応する可変ビットレートエンコーディングも搭載しています。際立った利点は、特許フリーのBSDライセンスという性質で、開発者は商用およびオープンソース製品の両方に自由に組み込むことができました。Speexはまた音響エコーキャンセレーション、ノイズ抑制、自動ゲインコントロールをバンドルしており、競合コーデックが通常外部ライブラリに委託する機能です。その開発者は2012年以来、公式に後継としてOpusを推奨していますが、Speexはレガシーなるものの、VoIPシステム、アーカイブされた録音、および軽量なデコーダーフットプリントが依然として価値のある組み込みデバイスで使用され続けています。
続きを読む
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

原音に忠実

NISTからSPXへのトランスコーディングは忠実な出力を実現します。変換エンジンがオーディオデータを精密かつ丁寧に処理します。

スピーディーな変換

最適化されたパイプラインがNISTをSPXへ迅速に変換します。録音をアップロードすれば、ほぼ即座に結果をお届けします。

リモート処理

NISTからSPXへの変換処理はリモートサーバーで実行されます。お使いのパソコンやスマートフォンに負荷がかかりません。

NISTをSPXへ変換する方法

1

コンピューター、Googleドライブ、Dropbox、URLからファイルを選ぶか、ページにドラッグして下さい.

2

spxもしくは必要な別のフォーマットを選ぶ(200種類以上のフォーマットが利用できます)

3

ファイルを変換すれば、すぐにspxファイルをダウンロードできます

フォーマットについて

NIST SPHERE(SPeech HEader REsources)は、アメリカ国立標準技術研究所がDARPA資金の音声研究プロジェクト向けに作成した特殊なオーディオファイル形式です。この形式は、サンプルレート、チャンネル数、エンコーディングタイプ、話者の属性、書き起こしアノテーションなどのメタデータをエンコードする構造化されたASCIIヘッダーで生のオーディオサンプルをラップし、音声コーパスの配布に最適です。NISTファイルは通常、電話品質のサンプルレート(8 kHzまたは16 kHz)で非圧縮PCMまたはmu-lawオーディオを格納しますが、コンテナはさまざまなエンコーディングを保持できる柔軟性があります。重要な利点は、研究者が詳細なコーパスメタデータをファイルに直接埋め込める豊富な自己文書化ヘッダーで、サイドカーファイルが不要になります。SPHEREはまた、TIMIT、Switchboard、Fisherコーパスなどの主要な音声データベースのデファクトスタンダードとなり、学術および政府の研究室全体で広く認知されています。オープンな仕様とコマンドラインツール(sphere、h_strip、w_decode)の利用可能性により、音声処理パイプラインでのファイルの変換、検査、処理が容易です。
初回リリース: 1990
Speexは、Xiph.Org FoundationのもとでJean-Marc Valinが開発した、音声圧縮に特化したオープンソースオーディオコーデックです。2002年10月に初めてリリースされ、VoIP、会議、およびネットワーク上で効率的に音声を伝送する必要があるあらゆるシナリオをターゲットとしています。SPXファイルはSpeexエンコードされたオーディオをOggコンテナ内にラップし、コーデックの音声最適化とOggのストリーミング機能を組み合わせています。3つのサンプリングレートがサポートされています — 8 kHzのナローバンド、16 kHzのワイドバンド、32 kHzのウルトラワイドバンド — さらに音声の複雑さにリアルタイムで適応する可変ビットレートエンコーディングも搭載しています。際立った利点は、特許フリーのBSDライセンスという性質で、開発者は商用およびオープンソース製品の両方に自由に組み込むことができました。Speexはまた音響エコーキャンセレーション、ノイズ抑制、自動ゲインコントロールをバンドルしており、競合コーデックが通常外部ライブラリに委託する機能です。その開発者は2012年以来、公式に後継としてOpusを推奨していますが、Speexはレガシーなるものの、VoIPシステム、アーカイブされた録音、および軽量なデコーダーフットプリントが依然として価値のある組み込みデバイスで使用され続けています。
初回リリース: 2002年10月15日

よくある質問

なぜNISTをSPXに変換するのですか?

NISTは音声を生の研究データとして保存します。Speexは音声圧縮に特化して最適化されており、高い音声明瞭度を保ちながらファイルサイズを削減します。

SPXファイルを開くソフトウェアは?

SPXファイルはVLC、Audacity、Speex互換アプリケーション、またはSoXコマンドラインツールで開けます。

変換前にオーディオ設定を調整できますか?

NISTファイルをSPXに変換する前に、サンプルレート、チャンネル、エンコーディング品質などのパラメータを調整できます。

NISTからSPXへの変換で音質は劣化しますか?

ロスレスターゲットでは元のデータがすべて維持されます。ロッシー形式はファイルサイズの大幅な削減と引き換えにわずかな品質低下がありますが、通常は識別できません。

複数のNISTファイルをまとめてSPXに変換できますか?

もちろんです。複数のNIST録音をコンバーターに追加し、一括でSPXに変換できます。

NISTからSPXへの変換は安全ですか?

はい — アップロードされたNIST録音は処理後すぐに消去されます。変換済みのSPX出力は24時間以内に削除されます。