2

私は次の質問を読みました:ここに

私がやろうとしているのは、さまざまなバット種からの呼び出しを含む信号 (.wav オーディオ ファイル) を取得することです。信号のグラフ表現は次のとおりです。

ここに画像の説明を入力

私がこれまでに行ったことは次のとおりです。

1) 信号を強調する

2) 信号を圧縮する

これは私がプロットした出力です:

ここに画像の説明を入力

考慮に値しない信号を削除する必要があります。現時点では、シグナルは 1D 表現であり、分離が完了すると、シグナルは呼び出しのみを含む 2D 表現になるため、各呼び出しの分析を実行できます。

これは、これを行うための私の推奨方法です。

1) 信号を次のブロックに分割します: 256x100 (重複するように)

2) 各ブロックの RMS (二乗平均平方根) を計算する

3) (2) をしきい値と比較し、ブロックが考慮に値する場合、これは呼び出しとして分類できます。

しかし、問題はこれです:

1) 信号を 256x100 のブロックに分割すると、呼び出しが行われ、RMS を計算するときに一部の呼び出しが失われますか?

2) したがって、適切なしきい値を選択するにはどうすればよいですか? 信号のピークを見つけることは、これに対する正確な仮定でしょうか?

誰かが私を助けてくれることを願っています:)

4

1 に答える 1