いくつかのデータセットで 2 つのアルゴリズム (メソッド) を使用し、いくつかの結果を得ました。得られた結果が同等かどうかを確認したいですか?サンプリングされた 2 つの KS テストを使用して、次の結果を得ました。テスト結果をどのように解釈すればよいですか? そして結論はどうあるべきですか?
KstestResult(statistic=0.11320754716981132, pvalue=0.8906908896753045)
D_alpha= 0.2641897545611759
いくつかのデータセットで 2 つのアルゴリズム (メソッド) を使用し、いくつかの結果を得ました。得られた結果が同等かどうかを確認したいですか?サンプリングされた 2 つの KS テストを使用して、次の結果を得ました。テスト結果をどのように解釈すればよいですか? そして結論はどうあるべきですか?
KstestResult(statistic=0.11320754716981132, pvalue=0.8906908896753045)
D_alpha= 0.2641897545611759
KS 検定は、分布を比較するために使用されます。したがって、それを適用すると、分布たとえば F(X) を別の分布 $G(X)$ と比較することに関心があります。通常、前者はデータ分布であり、後者は別のデータ分布または指定したもの (ガウス分布など) です。
ここで、検定の帰無仮説は F(X)=G(X) です。検定は、statistic
この帰無仮説が真であると仮定できるかどうかを評価するための を生成します。通常、この量を直接見ることはありません。むしろ、 を見たいと思いますp-value
。これは、帰無仮説が真である場合に、観察した統計よりも大きな統計を観察する確率です。この場合、p 値の値が低いということは、仮説が真である場合に観察した統計よりも大きな統計を観察する可能性がほとんどない (つまり、確率が低い) ことを示しています。したがって、小さな p 値を与える統計を観察したため、帰無仮説は偽であるに違いなく、実際に F(X) は G(X) とは異なると信じる傾向があります。
あなたの場合、p値は高いです(低いp値の場合、0.1、0.05、または0.01以下を意図しています)ので、帰無仮説を棄却しません。したがって、テストしたものは同じであり、統計的に異なるものではないと言えます。
ただし、テストの詳細、使用方法、および時期について読むことを強くお勧めします。また、それがあなたの場合に適切かどうかを理解しようとします。ウィキペディアとscipy docsでそれを行うことができます