任意の 2 つのサンプルの CDF 間の最大距離を計算するks テスト (2 サンプル)の scipy コードを実行していました。累積分布関数を計算するためのコード(CDF)。
cdf を計算するための行のロジックを理解できません。最初にdata1anddata2をソートしてから、 と の両方でnp.searchsortedの位置を見つけようとしています。は sortedとの連結に他なりません。data_alldata1data2data_alldata1data2
data2の最小値が 未満の場合はどうでしょうかdata1。cdfそれは値とともに減少してはならないという仮定に違反していませんか
data_all = np.concatenate([data1,data2])
cdf1 = np.searchsorted(data1,data_all,side='right')/(1.0*n1)
cdf2 = (np.searchsorted(data2,data_all,side='right'))/(1.0*n2)