車のドアがバタンと閉まる音や、トースターがトーストを出す音など、特定の音に対応するイベントをログに記録したいと考えています。
システムは「騒音検出器」よりも洗練されたものである必要があります。その特定の音を他の大きな音と区別できる必要があります。
識別はゼロレイテンシである必要はありませんが、プロセッサは、常にオンになっているマイクからの着信データの連続ストリームに対応する必要があります。
- このタスクは音声認識とは大きく異なりますか? または、音声認識ライブラリ/ツールキットを利用して、これらの非音声音を識別できますか?
- (サウンドのライブラリ間でマッチングするのではなく) 1 つのサウンドのみをマッチングする必要があるという要件がある場合、実行できる特別な最適化はありますか?
この回答は、一致したフィルターが適切であることを示していますが、詳細については漠然としています。ターゲット サウンドのバリエーションにより、ターゲット サウンドのサンプルとマイク ストリームとの間のオーディオ波形データに対する単純な相互相関が効果的であるとは思えません。
私の質問もこれに似ていますが、あまり注目されていませんでした。