いくつかの異なるミックスやリミックスなど、複数 (少なくとも 2 つ) の異なるオーディオ ファイルを検討してください。素朴に言うと、2 つ以上のファイルでほぼ等しいサンプル、特にボーカルを検出できるはずです。もちろん、ボーカル サンプルが変更、ストレッチ、ピッチ、リバーブされすぎていない場合に限ります。等
では、どのようなアルゴリズムや技術でこれを行うことができるのでしょうか? たとえば、ユーザーはすべてのファイルに可能な限りタイム マーカーを設定しようとするでしょう。タイム マーカーは、おそらく等しいサウンド、ボーカルなどを含む、比較するデータ ウィンドウを記述します。
どんな方法でもwavデータを直接比較しようとする直接的なアプローチは役に立たないことを私は知っています。しかし、周波数領域データ (FFT など) がある場合でも、比較ウィンドウをタイム スケールでシフトするような比較アルゴリズムを使用する必要があります。すべてのファイルに対して。
ご提案いただきありがとうございます。