2

ks.testR の関数を使用して、コルモゴロフ-スミルノフ テストを実行しています。Kolmogorov-Smirnov 検定は、

max(abs(difference(x, y)))

Wikipediaの Kolmogorov-Smirnov Test の定義によると、結果は同等になるはずです。

誰でも理由を知っていますか?

4

1 に答える 1

0

KS 統計は と等しいとは想定されていませんmax(|x-y|)。累積分布関数 (CDF) に適用されます。したがって、サンプル分布と参照分布の間で異なる観測値の割合を表します。

MATLABで実行された以下の 2 つの例を参照してください (ただし、結果はRでも同じであると予想しています)。

    x = [1 2 3 4 5 6 7 8 9 10];
    y = [1 2 3 4 5 6 7 8 9 11];

    [~, ~, ks2s] = kstest2(x,y)

    ks2s =

        0.1000                       (1)



    x = [1 2 3 4 5 6 7 8 9 10];
    y = [1 2 3 4 5 6 7 8 9 12];

    [~, ~, ks2s] = kstest2(x,y)

    ks2s =

        0.1000                        (2)

したがって、 と の最大絶対値差は (2) の方が大きくxなりyますが、異なるサンプルの割合が同じであるため、KS 統計量は同じです。

たとえばy、余分なサンプルがある場合、結果は次のように変化します。

    x = [1 2 3 4 5 6 7 8 9 10];
    y = [1 2 3 4 5 6 7 8 9 10 11];

    [h, p, ks2s] = kstest2(x,y)

    ks2s =

        0.0909
于 2016-09-27T17:06:44.780 に答える