9

2つの同じ長さのデータ配列を持つデータのセットがあるか、2項目のエントリの配列を作成できます。データによって表される相関と統計的有意性を計算したいと思います(密接に相関している場合もあれば、統計的に有意な相関関係はありません)。

私はPythonでプログラミングしていて、scipyとnumpyをインストールしています。Pythonでピアソンの相関と有意性を計算することを調べて見つけましたが、それはデータを操作して指定された範囲に収まるようにする必要があるようです。

2つの配列の相関と統計的有意性を教えてくれるようにscipyまたはnumpyに依頼する適切な方法は何ですか?

4

3 に答える 3

7

ピアソン相関係数を計算したい場合は、それscipy.stats.pearsonrが道です。ただし、重要性はより大きなデータセットに対してのみ意味があります。この関数では、指定された範囲に収まるようにデータを操作する必要はありません。相関の値は区間[-1,1]に収まります。おそらくそれが混乱の原因でしたか?

有意性がそれほど重要でない場合は、 を使用できますnumpy.corrcoef()

マハラノビス距離は 2 つの配列間の相関関係を考慮に入れていますが、相関関係ではなく距離測定値を提供します。(数学的には、マハラノビス距離は真の距離関数ではありませんが、特定の状況では非常に有利に使用できます。)

于 2012-06-20T14:55:29.943 に答える
2

これら 2 つの配列間のマハラノビス距離を使用すると、それらの間の相関関係が考慮されます。

関数は scipy パッケージにあります。scipy.spatial.distance.mahalanobis

ここに良い例があります

于 2012-06-20T14:37:19.887 に答える
0

scipy.spatial.distance.euclidean()

これにより、2 つの点、2 つの np 配列、2 つのリストなどの間のユークリッド距離が得られます。

import scipy.spatial.distance as spsd
spsd.euclidean(nparray1, nparray2)

ここで詳細情報を見つけることができますhttp://docs.scipy.org/doc/scipy/reference/spatial.distance.html

于 2012-06-20T14:55:25.357 に答える