2

電話に ( Stream オブジェクトとして) 記録された AMR ( Adaptive Multi-Rate ) オーディオ ファイルを PCM 非圧縮 wav オーディオ ストリームに変換して、後で音声認識のために処理できるようにする必要があります。音声認識は AMR 形式を好みません。これは、 Microsoft Speech Platformを使用したサーバー アプリケーションになります。で ffdshow または同様のライブラリを使用するかどうかはわかりません。

現在、NAudio と DirectShowNet を調査して、これを達成するのに役立つかどうかを確認していますが、誰かが正しい方向を示してくれることを望んでいました。

4

1 に答える 1

1

これに対する解決策をたくさん探した後、ffmpegを使用します。AMR-NB (NB=Narrow Band) デコーダーを提供します。ffmpegの C# ラッパーはたくさんあります。それらのほとんどは努力を放棄し、最新のものではありますが無料ではありません。基本的なパラメーターを指定してffmpegを実行するだけで、必要なものが提供され、しかも非常に高速です。

変換を行うために外部プロセスを呼び出すという考えは好きではありません。また、wav ファイルに変換できるように AMR ストリームをファイルとして保存する必要がありますが、効率的に動作させることができると信じています。

于 2010-10-08T15:49:40.830 に答える