0

2 つのデータセットの比較について問題があります。

今、私はセットAとセットBと言う2セットのデータを持っています.私がやろうとしていることは:

1.) セット A のデータに基づいて折れ線グラフをプロットする

2.) セット B のデータに基づいて別の折れ線グラフをプロットし、それをセット A のグラフに重ねます。

私の問題は、セット B のデータがセット A のデータよりもはるかに大きい (または小さい) 可能性があることです。しかし、これらのグラフを描画する目的は、この 2 つのグラフのパターンを比較することです。つまり、セット B のすべてのデータを N などの係数で乗算または除算して、結果のグラフが同様の範囲になるようにする必要があります ( getそれらはオーバーレイされます)。私の問題は、この N を見つける方法です。現在、この N を次のように取得しています。

1.) セット A の最大値と最小値の平均である平均 A を求めます。

2.) セット B の最大値と最小値の平均である平均 B を見つけます。

3.) B を A で割って N を取得します。

ただし、この方法の結果はあまり良くありません。2セットのデータを比較してそのようなNを見つけるためのより良いアルゴリズムはありますか?

4

2 に答える 2

0

両方のデータセットの移動平均を計算し、それらを分割して、中央移動平均を使用するのはどうですか。移動平均は本質的にスパイクを滑らかにします。

于 2012-07-09T08:13:46.417 に答える
0

データのセットごとに最適な線を作成し、2 つの線の間のコサイン類似度を計算できます。

これは、各データ セットが線形である場合にのみ機能します。

于 2012-07-10T02:32:11.183 に答える