エンジンに音声ファイル(wav / mp3 / etc ..)からのフレーズを正常に認識させるにはどうすればよいですか?
たとえば、音声ファイルと同じファイルのコンテキストの書かれたテキストがある場合、音声ファイルに書かれた単語を認識できるようにします。
私はSpeechRecognitionEngineをいじってみましたが、今のところ成功していません。
音声認識技術を扱うのはこれが初めてなので、アイデアに感謝します。
辞書を使用した音声認識の例を見てきましたが、ここでどのように役立つかわかりません。すべての音声ファイルをテキストに変換して、そのテキスト内の特定のフレーズを探すことを考えていましたが、それが正しい方法ではないと思います。たとえば、5時間の音声をテキストに変換するのは意味がないようです。あるいは、特定のフレーズを「辞書」として使用して、音声ファイルでこの項目を探すのは意味がないようです。