9

時系列の例のデータセットがあります。さまざまな時系列の例の間の類似性を計算したいのですが、スケーリングによる違いを考慮したくありません (つまり、絶対値ではなく、時系列の形で類似性を見たいのです)。したがって、この目的のために、データを正規化する方法が必要です。つまり、すべての時系列の例を特定の領域 ([0,100] など) の間に収めます。Pythonでこれを行う方法を誰か教えてもらえますか

4

5 に答える 5

10

timeseries が配列であると仮定すると、次のようにしてみてください。

(timeseries-timeseries.min())/(timeseries.max()-timeseries.min())

これにより、値が0から1に制限されます

于 2013-10-08T20:35:22.180 に答える
0

Python コードを提供するつもりはありませんが、正規化の定義は、すべての値 (データポイント) に対して "(value-mean)/stdev" を計算することです。あなたの値は 0 から 1 (または 0 から 100) の間に収まることはありませんが、それはあなたが望むものではないと思います。バリエーションを比較したい。これを行うと、これが残ります。

于 2014-01-31T17:35:28.090 に答える