algorithm - 2 つのデータセットが類似しているかどうかを判断する方法

Question

2 つのデータセットの比較について問題があります。

今、私はセットAとセットBと言う2セットのデータを持っています.私がやろうとしていることは:

1.) セット A のデータに基づいて折れ線グラフをプロットする

2.) セット B のデータに基づいて別の折れ線グラフをプロットし、それをセット A のグラフに重ねます。

私の問題は、セット B のデータがセット A のデータよりもはるかに大きい (または小さい) 可能性があることです。しかし、これらのグラフを描画する目的は、この 2 つのグラフのパターンを比較することです。つまり、セット B のすべてのデータを N などの係数で乗算または除算して、結果のグラフが同様の範囲になるようにする必要があります ( getそれらはオーバーレイされます）。私の問題は、この N を見つける方法です。現在、この N を次のように取得しています。

1.) セット A の最大値と最小値の平均である平均 A を求めます。

2.) セット B の最大値と最小値の平均である平均 B を見つけます。

3.) B を A で割って N を取得します。

ただし、この方法の結果はあまり良くありません。2セットのデータを比較してそのようなNを見つけるためのより良いアルゴリズムはありますか?

score 0 · Accepted Answer

両方のデータセットの移動平均を計算し、それらを分割して、中央移動平均を使用するのはどうですか。移動平均は本質的にスパイクを滑らかにします。

score 0 · Accepted Answer

データのセットごとに最適な線を作成し、2 つの線の間のコサイン類似度を計算できます。

これは、各データセットが線形である場合にのみ機能します。

algorithm - 2 つのデータセットが類似しているかどうかを判断する方法

2 に答える 2

Related

Reference