私は次の質問を読みました:ここに
私がやろうとしているのは、さまざまなバット種からの呼び出しを含む信号 (.wav オーディオ ファイル) を取得することです。信号のグラフ表現は次のとおりです。
私がこれまでに行ったことは次のとおりです。
1) 信号を強調する
2) 信号を圧縮する
これは私がプロットした出力です:
考慮に値しない信号を削除する必要があります。現時点では、シグナルは 1D 表現であり、分離が完了すると、シグナルは呼び出しのみを含む 2D 表現になるため、各呼び出しの分析を実行できます。
これは、これを行うための私の推奨方法です。
1) 信号を次のブロックに分割します: 256x100 (重複するように)
2) 各ブロックの RMS (二乗平均平方根) を計算する
3) (2) をしきい値と比較し、ブロックが考慮に値する場合、これは呼び出しとして分類できます。
しかし、問題はこれです:
1) 信号を 256x100 のブロックに分割すると、呼び出しが行われ、RMS を計算するときに一部の呼び出しが失われますか?
2) したがって、適切なしきい値を選択するにはどうすればよいですか? 信号のピークを見つけることは、これに対する正確な仮定でしょうか?
誰かが私を助けてくれることを願っています:)