SLNからSPHコンバーター
Asterisk SLN録音をSPHERE音声研究形式に変換
sln
sph
音声研究の標準
SLN電話音声をSPHに変換 — NISTや言語学研究コミュニティに信頼されるSPHERE形式。
PBXからコーパスへ
Asterisk電話録音を音声認識・音声学分析用の研究対応SPHファイルに変換。
安全なデータ処理
電話録音の機密性を保持。SLNは変換後に消去、SPH出力は24時間以内に削除。
SLNをSPHへ変換する方法
コンピューター、Googleドライブ、Dropbox、URLからファイルを選ぶか、ページにドラッグして下さい.
sphもしくは必要な別のフォーマットを選ぶ(200種類以上のフォーマットが利用できます)
ファイルを変換すれば、すぐにsphファイルをダウンロードできます
フォーマットについて
SLN(Signed Linear)は、8000 Hzモノの16ビット符号付きリニアPCMサンプルを格納するヘッダーレスの生オーディオ形式で、Digium(現Sangoma Technologies)が開発したオープンソースPBXフレームワークAsteriskと最も密接に関連しています。Asterisk内では、SLNはネイティブの内部オーディオ表現として機能し、すべてのコーデックトランスコーディング操作が中間ステップとしてSigned Linearを経由します。これにより、SLNはAsteriskのコーデック変換アーキテクチャのバックボーンとなっています。形式には生のサンプルだけが含まれ、ヘッダー、メタデータ、フレーミングは一切ありません。パラメータは事前に既知である必要があります。この自己記述性の欠如は一見制限に見えるかもしれませんが、サンプル形式が慣例で固定されており数千の同時チャンネルでオーバーヘッドバイトが重要となるテレフォニーでは実際には利点です。8000 Hzのレートは伝統的なテレフォニーのG.711標準と一致し、300-3400 Hzの完全な音声帯域をキャプチャします。Asteriskは広帯域オーディオ用の拡張バリアント(sln16、sln32、sln48)もサポートしています。SLNファイルはデコードが不要で、ダイレクトメモリマッピングだけで使え、高密度VoIP環境でのリアルタイムミキシング、会議、プロンプト再生に最適です。
SPHは、1990年頃に米国国立標準技術研究所が作成したNIST SPHERE(SPeech HEader REsources)形式で保存されたオーディオのファイル拡張子です。音声研究用に構築されたSPHファイルは、データベース識別子、チャンネル数、サンプルレート、バイトオーダー、圧縮タイプなどのメタデータが詰め込まれた1024バイトのASCIIヘッダーを持ち、すべての録音が自己記述的です。基盤となるオーディオは通常16 kHzで16ビットリニアPCMサンプリングですが、他の構成も許可されています。NIST、DARPA、および世界中の大学の研究者は、現代の自動音声認識システムの基盤となるTIMIT、Switchboard、LDCコレクションなどの音声コーパスの配布にSPHを使用しています。主な利点は、人間が読めるヘッダーにより、スクリプトがバイナリデコーディングなしに録音メタデータを解析できることです。形式の厳格な標準化により、機関やプラットフォーム間でデータセットを共有する際の曖昧さも排除されます。SPHファイルは非圧縮PCMを格納するため、完全なオーディオ忠実度が維持されます — 小さなアーティファクトでさえ結果を歪める可能性がある音響モデルのトレーニングにおいて重要です。
よくある質問
SLNをSPHに変換する理由は?
SPH(SPHERE)は言語学研究における音声コーパスの標準形式です。SLNを変換すれば電話音声を解析用に準備できます。
SPHファイルを使用するものは?
NIST音声ツール、HTK、Kaldi、言語研究フレームワークがSPHERE形式の音声データを扱います。
SPHにはメタデータが追加されますか?
はい — SPHERE形式は話者情報、録音条件、転写参照などのメタデータ用リッチテキストヘッダーを含みます。
一括変換は可能ですか?
複数のSLN録音をアップロードし、一度のセッションですべてSPHに変換 — 音声研究データセット構築に最適。
変換は安全ですか?
SLNのアップロードは処理後に削除され、SPH出力は24時間以内にサーバーから消去されます。