4

私は現在、大学でPythonを使用して同じピッチの音を演奏するさまざまな楽器を区別するプロジェクトを行っています。

コンピューターに取り付けられたマイクを使って、さまざまな楽器でさまざまな音符を録音しました。

部屋の背景も記録しました。

これまでのところ、さまざまな楽器のさまざまなノートのプロットがあります。ここで、y軸には、dB単位の振幅があります。20* log10(| FFT(signal)|)

そして、x軸にはDFTサンプル周波数があります

いくつかの高調波ピークは、ノイズが要因となるのに十分小さい(または背景が十分に大きい)-(私は初心者なので画像を投稿できません!)私の問題は、高さの不確実性のレベルを計算することですバックグラウンドノイズを考慮するとピークになります。

私の質問は:

さて、バックグラウンドノイズを考慮したときにピークの高さ(それらの相対的な高調波振幅)の不確かさのレベルを計算する方法。

いくつかのアイデア:

高調波ピークとは何か、ノイズに起因するものを分類するときに使用する必要があるdBしきい値は何ですか(最大バックグラウンド(〜28000dB)または平均(〜15000)、あるいはこれらの値の2倍よりも低いピークを割り引く必要があります)?

また、バックグラウンドによって発生するノイズを考慮するために、楽器の録音のFFTビンnからバックグラウンドのFFTビンnの値を差し引くことは正当ですか?

また、MATLABでfftを使用して、録音されたサウンドからノイズを除去するにはどうすればよいですか?、そこには非常に異なる意見があるようです。

関連性がある場合は、クラスメートの盗用の場合でも、コードの一部を投稿することができます。

プロジェクトに役立つ文献へのリンクをいただければ幸いです。(まだ、各機器の識別属性を探すために考えられるあらゆる方法でデータをプロットしている段階です)。

前もって感謝します

4

1 に答える 1

3

あなたは多くの質問をしているようです。あなたの最初のものに答えることから始めましょう:

さて、バックグラウンドノイズを考慮したときにピークの高さ(それらの相対的な高調波振幅)の不確かさのレベルを計算する方法。

音は線形に(一次近似に)加算されると予想されます。自然なことは、背景のみを記録してから、背景の高調波の平均振幅と標準偏差を測定することです。

例として、20KHz、11KHz、33KHzの3つの高調波を見ているとします。バックグラウンドのみの録音を行うと、平均振幅が1.3dB 2.2dBおよび2.3dBで、標準偏差が+/- 0.1、+ /-0.2、および+/-0.4dBであることがわかります。これで、不確実性の推定値と、減算する平均バックグラウンド高調波が得られました。

これを行うためのより賢い方法がありますが、それは始まりです。

それでは、2番目の質問に進みましょう

高調波ピークとは何か、ノイズに起因するものを分類するときに使用する必要があるdBしきい値は何ですか(最大バックグラウンド(〜28000dB)または平均(〜15000)、あるいはこれらの値の2倍よりも低いピークを割り引く必要があります)?

ピークが平均+不確実性(1つまたは2つの標準偏差、これは実際には任意であり、慣例によって異なります)内にある場合、それは重要であると言えます。たとえば、3KHzでのノイズレベルが1.2dBで不確かさが+/- 0.3dBであり、高調波が1.3dBであり、不確かさが0.1dB(同じ方法で測定)であることがわかった場合、それは重要ではありません。

次に、第3部について説明します。

また、バックグラウンドによって発生するノイズを考慮するために、楽器の録音のFFTビンnからバックグラウンドのFFTビンnの値を差し引くことは正当ですか?

はい(一般的に言えば)。これを本当に納得させたい場合は、A)波を合計してFFTを実行するシミュレーションを実行するか、B)実験を実行してAまたはCと同じようにすることができます。フーリエ変換の数学を実行します。

文学に関しては、それはあなたが具体的に何をしているのかによると思います。あなたが物理学の学生なら、メアリー・ボアスの「物理科学の数学的方法」は、コンピュータ科学者/エンジニアであれば、フーリエ変換をうまく扱います。あなたはおそらく何か違うものが欲しいでしょう。

さらにサポートが必要な場合はお知らせください。

于 2012-04-16T16:06:05.357 に答える