私は現在、大学でPythonを使用して同じピッチの音を演奏するさまざまな楽器を区別するプロジェクトを行っています。
コンピューターに取り付けられたマイクを使って、さまざまな楽器でさまざまな音符を録音しました。
部屋の背景も記録しました。
これまでのところ、さまざまな楽器のさまざまなノートのプロットがあります。ここで、y軸には、dB単位の振幅があります。20* log10(| FFT(signal)|)
そして、x軸にはDFTサンプル周波数があります
いくつかの高調波ピークは、ノイズが要因となるのに十分小さい(または背景が十分に大きい)-(私は初心者なので画像を投稿できません!)私の問題は、高さの不確実性のレベルを計算することですバックグラウンドノイズを考慮するとピークになります。
私の質問は:
さて、バックグラウンドノイズを考慮したときにピークの高さ(それらの相対的な高調波振幅)の不確かさのレベルを計算する方法。
いくつかのアイデア:
高調波ピークとは何か、ノイズに起因するものを分類するときに使用する必要があるdBしきい値は何ですか(最大バックグラウンド(〜28000dB)または平均(〜15000)、あるいはこれらの値の2倍よりも低いピークを割り引く必要があります)?
また、バックグラウンドによって発生するノイズを考慮するために、楽器の録音のFFTビンnからバックグラウンドのFFTビンnの値を差し引くことは正当ですか?
また、MATLABでfftを使用して、録音されたサウンドからノイズを除去するにはどうすればよいですか?、そこには非常に異なる意見があるようです。
関連性がある場合は、クラスメートの盗用の場合でも、コードの一部を投稿することができます。
プロジェクトに役立つ文献へのリンクをいただければ幸いです。(まだ、各機器の識別属性を探すために考えられるあらゆる方法でデータをプロットしている段階です)。
前もって感謝します