スケールが異なる 2 つのデータ セット/曲線をどのように関連付けますか。つまり、1 つの曲線の y 軸の範囲は (0,70000) からであり、別の曲線の y 軸の範囲は (0, 150000) です。それらが同じスケールにある場合は、cor() 関数を使用できます。ある曲線が他の曲線に依存しているかどうか、または両方の曲線が関連しているかどうかを確認したかったのです。何か案は?
4917 次
3 に答える
3
ピアソンの相関積率(cor
デフォルトで計算されるもの) の定義を見ると、それが線形演算子であることがわかります。つまり、a と b が定数の場合、cor(aX + b, Y) = cor(X, Y) です。したがって、X と Y の範囲の違いは重要ではありません。ただし、この相関は線形依存のみを測定することに注意してください。それらは「関連」している可能性がありますが、相関は低いです。これは、関係が非線形の場合に発生する可能性があります。たとえば、次のようになります。
set.seed(100)
x <- rnorm(100)
y <- x^2
cor(x,y)
# 0.1224623
于 2012-08-24T21:24:27.443 に答える
2
2 つのデータ セット間の相関を探している場合、相関の量はデータ セットの範囲の違いには依存しません。
たとえば、ランダムなy
値のセットを作成し、それらをスケールアップできます。相関はまだ 1 です。
> y <- rnorm(100)
> y2 <- y*2 + 20
> cor(y, y2)
[1] 1
相関の量がスケールの線形変化とは無関係であることをさらに示すために、相関のないデータの場合を見てください。
> y3 = rnorm(100)
> cor(y, y3)
[1] -0.05293818
> y4 <- y3*2 + 20
> cor(y, y4)
[1] -0.05293818
それで、あなたの質問に答えるために。cor
この機能はまだうまく機能するはずです。
于 2012-08-24T20:43:42.477 に答える
0
相関関係は、データの絶対範囲に依存するべきではないと思います。1 つのデータ セットに定数を掛けて、他のデータ セットと同じ範囲にするだけですか?
于 2012-08-24T20:44:28.403 に答える