拍手音を検出できるようにしたいと思います。あらゆる形式の音声認識にかなり慣れていないので、これを行う簡単な方法はありますか? そうでない場合は、C# の音声認識/検出に適したリソースはありますか?
私の目標は、いくつかの基本的な拍手ベースのコントロールを使用して、クライアントのメディア センターを自動化することです。
拍手音を検出できるようにしたいと思います。あらゆる形式の音声認識にかなり慣れていないので、これを行う簡単な方法はありますか? そうでない場合は、C# の音声認識/検出に適したリソースはありますか?
私の目標は、いくつかの基本的な拍手ベースのコントロールを使用して、クライアントのメディア センターを自動化することです。
過去に同様の質問がありました:
オーディオストリームが与えられた場合、ドアがバタンと閉まるタイミングを見つけます(音圧レベルの計算?)
質問はC#に固有のものではありませんでしたが、使用するアルゴリズムについていくつかのアイデアがあります。(開示:はい、私はその質問に答えました。)
これが役立つかどうかはわかりませんが、それでも:MERL-サウンド認識。またはさらに良いことに、マイク付きの拍手検出。
私はそのような言語ではなく、アルゴリズムに焦点を合わせます。
音のどのような特徴により、拍手として識別できますか?間隔?強度?時間の経過に伴う強度の変化?
アルゴリズムを入手したら、それを実装するための最良の方法を決定します。
いわゆる主成分分析を使用して解決できる問題のようです。グーグルしてみてください。また、有名なカクテルパーティー問題の他の解決策が役立つかもしれません。しかし、私はすでにそこにいくつかのライブラリがあると確信しています。
25 ドルのAudio Zone Triggerをチェックしてみてください。