データのヒストグラムが同じ分布からのものであるかどうかを判断するために、scipy の ks_2samp 関数を使用して Kolmogorov-Smirnoff テストを実行しようとしています。返された p 値は、時々正しくないように見えます...
たとえば、次のヒストグラムを使用します。
aa, bb, cc = ax1.hist(list1, numpy.arange(a-1, b+3, c), alpha = .5, align = 'mid', rwidth=1, linestyle = 'dashed', linewidth = 1.5)
dd, ee, ff = ax1.hist(list2, numpy.arange(a-1, b+3, c), alpha = .5, align = 'mid',rwidth=1)
print ks_2samp(aa, dd)`[1]`
約 .96 の p 値が返されましたが、これは正しくないようです...何か間違っているのでしょうか? これらのヒストグラムは、p 値が低くなるのに十分なほど異なるべきではありませんか?