3

音声認識エンジン(Microsoft Speech SDKを使用)をコーディングしてビデオファイルを「リッスン」し、検出をファイルに保存するにはどうすればよいですか?

4

1 に答える 1

2

これはこの質問と非常によく似ており、非常によく似た答えがあります。オーディオ部分を分離し、WAV形式に変換して、inprocレコグナイザーに送信する必要があります。

ただし、前に説明したのと同じ問題があります(トレーニングが必要で、単一の音声を想定し、マイクがスピーカーの近くにあると想定します)。その場合は、かなり良い結果が得られる可能性があります。そうでない場合(つまり、テレビ番組を書き写そうとしている場合、またはさらに悪いことに、ある種のカムコーダーオーディオを書き写そうとしている場合)、結果は満足のいくものではない可能性があります。

于 2009-11-10T23:18:22.677 に答える