VOCからHTKコンバーター

Sound Blaster VOCをHTKリサーチ形式に変換

ここにファイルをドロップする. 1 GB ファイルサイズの最大限度 または サインアップ
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

音声リサーチツール

HTKは音声認識リサーチの基盤です。VOC音声録音をHTKに変換することで、MLトレーニングワークフローに直接フィードできます。

VOCからリサーチデータへ

Sound Blaster音声録音をHTK形式に変換 — 特徴抽出とHidden Markov Modelトレーニングに対応しています。

オンライン変換

SoXコマンドラインは不要です。VOCファイルをローカルツールのインストールなしにブラウザで直接HTKに変換できます。

VOCをHTKへ変換する方法

1

コンピューター、Googleドライブ、Dropbox、URLからファイルを選ぶか、ページにドラッグして下さい.

2

htkもしくは必要な別のフォーマットを選ぶ(200種類以上のフォーマットが利用できます)

3

ファイルを変換すれば、すぐにhtkファイルをダウンロードできます

フォーマットについて

VOC(Creative Voice)は、Creative Technologyが開発し、1989年にオリジナルのSound Blasterカードとともに導入されたデジタルオーディオコンテナです。DOS時代にCreativeのハードウェアがPCオーディオを支配していた時期のネイティブオーディオ形式として機能しました。VOCファイルはブロックベースです — 各ファイルは8ビット符号なしPCM、4ビットおよび2.6ビットCreative ADPCM、16ビット符号付きPCM、さらにA-lawおよびmu-lawエンコードされたオーディオを運ぶことができる型付きデータブロックで構成されます。このブロック構造はまた無音インターバル、リピートループ、マーカーポイントもサポートし、ゲーム開発者にサウンド再生のきめ細かな制御を提供しました。注目すべき利点はハードウェアレベルのデコーディングでした — Sound BlasterカードがDMA転送を介してVOCデータを直接再生でき、プロセッササイクルが貴重な時代にCPUを解放しました。この形式はid Software、Sierra、LucasArtsのDOSゲームで広く使用されました。WindowsとWAV形式の台頭とともに、VOCは徐々に主流から姿を消しましたが、レトロゲームの保存やビンテージPCオーディオアーカイブの作業に携わる方にとって依然として重要です。
初回リリース: 1989
HTKは、ケンブリッジ大学工学部が開発した音声認識研究用ソフトウェアスイートHidden Markov Model Toolkitのネイティブ波形コンテナです。1993年に初めて配布され、HTKは世界中の計算言語学研究室でリファレンスプラットフォームとなり、そのファイル形式も同様に広まりました。各ファイルにはパラメータベクトルまたは生のサンプルが格納され、フレーム数、100 ns単位のフレーム周期、フレームあたりのバイト数、およびデータの種類を示すタイプコードを指定する12バイトのヘッダーが先行します — オプションは波形PCMからメル周波数ケプストラム係数やフィルタバンクエネルギーまで多岐にわたります。この汎用性により、単一のコンテナがパーサーを変更することなくソースオーディオと抽出された特徴量の両方を保持できます。意図的に最小限のヘッダーはアラインメントパディングやオプションチャンクを避け、C、Python、MATLABから数行のバイナリI/Oで簡単に読み取れます。HTKの持続的な関連性を支える3つの利点は、HTKトレーニングおよび認識パイプラインとの緊密な統合、パーサーの曖昧さを排除する決定論的なバイトレイアウト、そしてアカデミックコーパスでの広範な採用です。
初回リリース: 1993

よくある質問

なぜVOCをHTKに変換するのですか?

HTKはHidden Markov Model Toolkitのデータ形式で、音声認識リサーチで広く使用されています。MLトレーニングパイプライン向けの音声を準備します。

HTKファイルは何で開けますか?

HTKツールキット、SoX、カスタム音声認識フレームワークがHTKファイルを読み込めます。主にリサーチと開発向けの形式です。

HTK形式とは何ですか?

HTKはHidden Markov Model Toolkitのオーディオ形式 — 音声認識システムの構築とMLに向けたオーディオ特徴量の格納に使用されます。

HTKはリサーチ外でも使われていますか?

HTKは主に学術的です。商業的な音声認識は他のフレームワークを使用しますが、HTKは教育とプロトタイピングの基盤として残っています。

HTKを通常のプレーヤーで開けますか?

HTKファイルは標準的なメディアプレーヤーでは再生できません。HTKツールキットと音声処理パイプライン向けに設計されています。