algorithm - 風切り音の検出

Question

音声ストリームに従って風を検出するアプリを開発したいと考えています。
ガイドラインやリンクを提供するために、ここで専門家の考えが必要です。これは簡単な作業ではないことはわかっていますが、ここで多くの努力を払うことを計画しています.

私の計画は、ストリーム内のいくつかの一般的なパターンを検出することです。値が風切り音のこの一般的なパターンに近い場合は、一致が見つかったことを通知します。値が既知のパターンに近い場合は、素晴らしいと確信できます。風が検出され、値がパターンと一致しない場合は、それほど風がないと思います....

それが最初の私の計画ですが、これがどのように行われるかを学ぶ必要があります. すでにこれを行っている開いているプロジェクトはありますか? または、このトピックについて研究を行っている人がいますか?

私がこのフォーラムに書き込む理由は、Google で検索する方法がわからないためです。私が見つけたものは、私が探していたものではありませんでした。この種のアルゴリズムの開発を開始する方法が本当にわかりません。

編集 1:
風を録音しようとしましたが、保存されたオーディオファイルを開くと、単なる数字の集まりでした :)。これをどの形式で保存すればよいかさえわかりません。wave で十分ですか? 何か他のものを使用する必要がありますか、または風切り音のオーディオファイルを mp3 に変換するとどうなりますか: これは解析に役立ちますか?

多くの質問をいただきましたが、それは、この種のトピックについてどこから読んだらよいか分からないからです。質問にガイドラインのタグを付けているので、誰かが私を助けてくれることを願っています.

検出可能な何かがあるに違いありません。なぜなら、風切り音は非常に一般的だからです。これを検出するには何らかの方法が必要です。ヒントを教えてくれる人、このトピックに精通している誰かが必要なだけです。

score 3 · Accepted Answer

あなたの問題の科学は「パターン分類」と呼ばれ、特に「オーディオパターン分類」のサブフィールドです。このタスクは、録音物を 2 つのクラス (風と非風) に分類するものとして抽象化されます。あなたはまだ信号処理について十分な知識を持っていないようです。そのため、重要な警告を 1 つ挿入させてください。 パターンの分類は、一見したほど簡単ではありません。人間はパターン分類に優れています。コンピューターはそうではありません。

多くの場合、適切な最初のアプローチは、信号とサンプルのフーリエ変換の相関を計算することです。ただし、風速にどれだけ依存するかはわかりません。

バッグ・オブ・フレームのアプローチを見たいと思うかもしれません. それは周囲の騒音を分類するためにうまく使われました.

score 2 · Accepted Answer

@thitonが述べたように、これはオーディオパターン分類の例です。

風の主な特徴：振幅とピッチに小さな半ランダムな変動がある、整形された（バンド/ hpフィルター処理された）ホワイトノイズです。少なくともそれはほとんどのシンセサイザーがそれを再現する方法であり、それは非常に説得力があるように聞こえます。

スペクトルの内容とウェーブファイルの変更を確認する必要があるため、FFTが必要になります。入力フォーマットは実際には重要ではありませんが、明らかに原材料（wav）の方が優れています。

それを取得したら、それが何らかの色付きノイズに近いことを検出し、おそらく一連のピッチと振幅を抽出して、そのデータセットに従来のパターン分類アルゴリズムを使用してみてください。ここでは、教師あり学習が機能すると思います。

score 1 · Accepted Answer

これは実際には解決が難しい問題です。

マイクデータが 1 つしかないとします。オーディオファイル (時間領域信号) を開いたときに取得する生データには、この種の処理に関する情報はいくらか含まれていますが、それほど多くはありません。FFT を使用して周波数領域に入り、周波数ビンの統計を調べ、それを使用して SVM またはランダムフォレストを使用して分類器を構築する必要があります。

@Karoly-Horvathに敬意を表して、mp3などの圧縮された録音も使用しません。オーディオ圧縮アルゴリズムは常に高周波数を歪めますが、これは現在、風を検出する上で重要な機能です。可能であれば、マイクから生の PCM データを取得します。また、録音が少なくとも 24kHz でサンプリングされていることを確認して、最大 12kHz までの信号の情報を取得する必要があります。

最後に - 周波数領域での風の形状は、単純なフィルタリングされたホワイトノイズではありません。特徴は、通常、低周波に高いエネルギーがあり（ゴロゴロするタイプの音）、高周波にせん断音や羽ばたき音があることです。高周波エネルギーは非常に一時的であるため、FFT サイズが大きすぎると、この重要な機能を見逃すことになります。

2 つのマイクデータがある場合、これは少し簡単になります。記録された風は局所的な現象です。確かに、録音では葉のざわめきや風によるチャイムの音が聞こえます。しかし、それは風切り音ではなく、フィルターで除去すべきではありません。

録音で聞こえる実際の不快な風切り音は、マイクの膜に当たる空気です。その効果はローカルイベントであり、マイクが 2 つある場合に利用できます。イベントは個々のマイクごとにローカルであり、他のマイクとは相関していないため、悪用される可能性があります。もちろん、2 本のマイクの位置関係も重要です。それらは互いに適度に近くなければなりません (たとえば、8 インチ以内)。

次に、時間領域の相関関係を使用して、風切り音の存在を判断できます。(マイクが互いにかなり接近しているため、録音された他のすべての音は互いに相関しています。したがって、相関が高いと風がないことを意味し、相関が低いと風があることを意味します)。この方法を使用する場合、入力オーディオファイルを圧縮解除する必要はありません。合理的な圧縮アルゴリズムはこれに影響しません。

この概要がお役に立てば幸いです。

algorithm - 風切り音の検出

4 に答える 4

Related

Reference