CDDA から HTK コンバーター

CDオーディオを音声認識用HTKフォーマットに変換

ここにファイルをドロップする. 1 GB ファイルサイズの最大限度 または サインアップ
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

音声研究フォーマット

CDDAオーディオをHTK用に準備——Hidden Markov Model Toolkitの音声認識研究で求められるフォーマットです。

クラウド処理

HTK変換は当社サーバーで実行。HTKツールキットのインストール不要——適切な形式のオーディオを即座に取得できます。

CD品質の入力

非圧縮CDDAからの開始により、音声研究者は特徴量抽出やモデル訓練に最高忠実度のオーディオを活用できます。

CDDAをHTKへ変換する方法

1

コンピューター、Googleドライブ、Dropbox、URLからファイルを選ぶか、ページにドラッグして下さい.

2

htkもしくは必要な別のフォーマットを選ぶ(200種類以上のフォーマットが利用できます)

3

ファイルを変換すれば、すぐにhtkファイルをダウンロードできます

フォーマットについて

CDDA(Compact Disc Digital Audio)はRed Book規格として知られ、音楽CDに保存されるオーディオを定義しています。ソニーとフィリップスが共同開発し1980年に発表されたこの規格は、数十年にわたりデジタルオーディオを形作るパラメータを確立しました — 16ビットリニアPCM、44.1 kHzステレオ、非圧縮で1,411.2 kbpsです。各ディスクは最大80分を保持し、インデックスポイント付きのトラック、テキスト表示用のサブチャンネルデータ、および軽微な傷があっても確実な再生を保証するエラー訂正符号(CIRC)で構成されます。CDからオーディオがリッピングされると、結果のストリームは変換前の生のPCMとして.cdda拡張子で保存されることがよくあります。最も明白な利点は非圧縮でロスレスな性質です — 耳に届くものは、指定された解像度でのスタジオマスターと数学的に同一です。堅牢なエラー訂正により優れた耐久性を提供し、ディスク表面が中程度の摩耗を受けてもオーディオの整合性を維持します。1982年の最初の商業リリース以来数十億枚を売り上げたCDDAは、デジタル音楽の基準品質の期待値を確立し、圧縮コーデックの比較基準として今も使われています。
開発元: Sony / Philips
初回リリース: 10月 1980
HTKは、ケンブリッジ大学工学部が開発した音声認識研究用ソフトウェアスイートHidden Markov Model Toolkitのネイティブ波形コンテナです。1993年に初めて配布され、HTKは世界中の計算言語学研究室でリファレンスプラットフォームとなり、そのファイル形式も同様に広まりました。各ファイルにはパラメータベクトルまたは生のサンプルが格納され、フレーム数、100 ns単位のフレーム周期、フレームあたりのバイト数、およびデータの種類を示すタイプコードを指定する12バイトのヘッダーが先行します — オプションは波形PCMからメル周波数ケプストラム係数やフィルタバンクエネルギーまで多岐にわたります。この汎用性により、単一のコンテナがパーサーを変更することなくソースオーディオと抽出された特徴量の両方を保持できます。意図的に最小限のヘッダーはアラインメントパディングやオプションチャンクを避け、C、Python、MATLABから数行のバイナリI/Oで簡単に読み取れます。HTKの持続的な関連性を支える3つの利点は、HTKトレーニングおよび認識パイプラインとの緊密な統合、パーサーの曖昧さを排除する決定論的なバイトレイアウト、そしてアカデミックコーパスでの広範な採用です。
初回リリース: 1993

よくある質問

なぜCDDAをHTKに変換するのですか?

HTKはHidden Markov Model Toolkitのネイティブフォーマットです。CDDAをHTKに変換すれば、音声認識の訓練と研究に使えるオーディオを準備できます。

HTKは何に使われますか?

HTKはケンブリッジ発の音声認識研究ツールキットです。その形式はモデルの訓練と評価のためにオーディオ特徴量と波形を格納します。

HTKはCD品質をフルサポートしますか?

HTKは様々なサンプルレートに対応。音声認識は通常16kHzを使用しますが、必要であればCDDAの44.1kHzもサポートします。

HTKを読めるソフトは?

HTK Toolkit本体に加え、SoXや各種音声処理フレームワークがHTKフォーマットのオーディオを読み書きできます。

一括変換できますか?

複数のCDDAファイルをアップロードし、まとめてHTKに変換——CD録音から音声コーパスを効率的に構築できます。