任意の 2 つのサンプルの CDF 間の最大距離を計算するks テスト (2 サンプル)の scipy コードを実行していました。累積分布関数を計算するためのコード(CDF)
。
cdf を計算するための行のロジックを理解できません。最初にdata1
anddata2
をソートしてから、 と の両方でnp.searchsorted
の位置を見つけようとしています。は sortedとの連結に他なりません。data_all
data1
data2
data_all
data1
data2
data2
の最小値が 未満の場合はどうでしょうかdata1
。cdf
それは値とともに減少してはならないという仮定に違反していませんか
data_all = np.concatenate([data1,data2])
cdf1 = np.searchsorted(data1,data_all,side='right')/(1.0*n1)
cdf2 = (np.searchsorted(data2,data_all,side='right'))/(1.0*n2)