音符とデジタル オーディオを比較するアプリケーションに取り組んでいます。私の最初のアイデアは、いくつかのポリフォニック ピッチ アルゴリズムを使用して wav ファイル (またはリアルタイムのサウンド) を分析し、このファイルから音符と和音を取得し、その後データセット内の音符と比較することでした。私は多くのページを調べましたが、既存の実装とアルゴリズムは主にモノフォニック サウンドのみに焦点を当てているため、大変な作業のようです。
今、私はこれを逆の方法で行うというアイデアを得ました。データセットには、たとえばメモがあります:A4またはより良いコードの例:A4 B4 H4。そして、私の考えは、この音符または和音からいくつかの波(または私が知らないもの)を作成し、デジタルオーディオと比較することです。
これは良い考えですか?それはより良い/より難しい解決策ですか? はいの場合、その方法をお勧めできますか?