1

データのヒストグラムが同じ分布からのものであるかどうかを判断するために、scipy の ks_2samp 関数を使用して Kolmogorov-Smirnoff テストを実行しようとしています。返された p 値は、時々正しくないように見えます...

たとえば、次のヒストグラムを使用します。

ヒストグラム.jpg

aa, bb, cc = ax1.hist(list1, numpy.arange(a-1, b+3, c), alpha = .5, align = 'mid', rwidth=1, linestyle = 'dashed', linewidth = 1.5)

dd, ee, ff = ax1.hist(list2, numpy.arange(a-1, b+3, c), alpha = .5, align = 'mid',rwidth=1)

print ks_2samp(aa, dd)`[1]`

約 .96 の p 値が返されましたが、これは正しくないようです...何か間違っているのでしょうか? これらのヒストグラムは、p 値が低くなるのに十分なほど異なるべきではありませんか?

4

1 に答える 1

3

ks_2sampコルモゴロフ-スミルノフ検定を 2 つの標本に適用し、両方が同じ分布に由来するという帰無仮説を検定します。

したがって、入力としてks_2samp2 つのサンプル (ここlist1list2) も取得します。

ks_2samp(list1, list2)
于 2016-07-15T21:49:34.070 に答える