ks.test
R の関数を使用して、コルモゴロフ-スミルノフ テストを実行しています。Kolmogorov-Smirnov 検定は、
max(abs(difference(x, y)))
Wikipediaの Kolmogorov-Smirnov Test の定義によると、結果は同等になるはずです。
誰でも理由を知っていますか?
ks.test
R の関数を使用して、コルモゴロフ-スミルノフ テストを実行しています。Kolmogorov-Smirnov 検定は、
max(abs(difference(x, y)))
Wikipediaの Kolmogorov-Smirnov Test の定義によると、結果は同等になるはずです。
誰でも理由を知っていますか?
KS 統計は と等しいとは想定されていませんmax(|x-y|)
。累積分布関数 (CDF) に適用されます。したがって、サンプル分布と参照分布の間で異なる観測値の割合を表します。
MATLABで実行された以下の 2 つの例を参照してください (ただし、結果はRでも同じであると予想しています)。
x = [1 2 3 4 5 6 7 8 9 10];
y = [1 2 3 4 5 6 7 8 9 11];
[~, ~, ks2s] = kstest2(x,y)
ks2s =
0.1000 (1)
x = [1 2 3 4 5 6 7 8 9 10];
y = [1 2 3 4 5 6 7 8 9 12];
[~, ~, ks2s] = kstest2(x,y)
ks2s =
0.1000 (2)
したがって、 と の最大絶対値差は (2) の方が大きくx
なりy
ますが、異なるサンプルの割合が同じであるため、KS 統計量は同じです。
たとえばy
、余分なサンプルがある場合、結果は次のように変化します。
x = [1 2 3 4 5 6 7 8 9 10];
y = [1 2 3 4 5 6 7 8 9 10 11];
[h, p, ks2s] = kstest2(x,y)
ks2s =
0.0909