signal-processing - デジタルオーディオとピッチを比較する

Question

音符とデジタルオーディオを比較するアプリケーションに取り組んでいます。私の最初のアイデアは、いくつかのポリフォニックピッチアルゴリズムを使用して wav ファイル (またはリアルタイムのサウンド) を分析し、このファイルから音符と和音を取得し、その後データセット内の音符と比較することでした。私は多くのページを調べましたが、既存の実装とアルゴリズムは主にモノフォニックサウンドのみに焦点を当てているため、大変な作業のようです。

今、私はこれを逆の方法で行うというアイデアを得ました。データセットには、たとえばメモがあります：A4またはより良いコードの例：A4 B4 H4。そして、私の考えは、この音符または和音からいくつかの波（または私が知らないもの）を作成し、デジタルオーディオと比較することです。

これは良い考えですか？それはより良い/より難しい解決策ですか? はいの場合、その方法をお勧めできますか？

score 1 · Accepted Answer

最も簡単な解決策は、波形の FFT (高速フーリエ変換) を取得することです。すべての音符 (およびその倍音) が信号に含まれます。次に、ノートに対応する周波数を探します。解決策があります。

注 - 適切な周波数分解能を得るには、十分に長いサンプルと十分に高いサンプルレートが必要です。しかし、試してみてください。

これは、私がピアノの前に座って撮った SpectraWave というアプリのスクリーンショットです。最初は真ん中のAです（ご存知のようにf = 440 Hz）：

ここに画像の説明を入力

2番目はAマイナーコードです（ご覧のとおり、私の中指は少し強く、Cは最大の音量の音として現れています）. ハーモニクスにより、すぐにいくつかの音符以上のものを見るのが難しくなります…</p>

ここに画像の説明を入力

score 0 · Accepted Answer

あなたの「解決策」は、各音符に対してどのような波形を作成すればよいかわからないため、マッチングをさらに難しくする可能性が高くなります。ほとんどの楽器や声は、単一の正弦波やその他のよく知られている波形とは大きく異なる波形を生成するだけでなく、これらの波形は時間とともに変化します。したがって、一致する各音符に使用する適切な波形を推測することは、ほとんどありません。

signal-processing - デジタルオーディオとピッチを比較する

2 に答える 2

Related

Reference