問題タブ [kolmogorov-smirnov]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
2006 参照

python - scipy.stats.kstest を使用した 2 標本コルモゴロフ–スミルノフ検定

scipy.stats.kstest を使用して、2 サンプルのコルモゴロフ–スミルノフを実行するかどうかをテストします。つまり、データの 2 つの列 (サンプル) が基になる母集団分布関数が異なるかどうかをテストします。kstest はこれを行うことができますか?

私の問題は、特定のサンプルを正規分布、t 分布などの既知の分布と比較するために kstest を使用する方法をドキュメントでしか見つけることができなかったことです。

0 投票する
1 に答える
642 参照

python - 2 サンプル KS テスト - 何かが間違っているようです

データのヒストグラムが同じ分布からのものであるかどうかを判断するために、scipy の ks_2samp 関数を使用して Kolmogorov-Smirnoff テストを実行しようとしています。返された p 値は、時々正しくないように見えます...

たとえば、次のヒストグラムを使用します。

ヒストグラム.jpg

約 .96 の p 値が返されましたが、これは正しくないようです...何か間違っているのでしょうか? これらのヒストグラムは、p 値が低くなるのに十分なほど異なるべきではありませんか?

0 投票する
1 に答える
1551 参照

r - Matlab での 2 サンプル Kolmogorov-Smirnov テスト (kstest2) の実装が不十分ですか?

明らかな何かが欠けているのでしょうか、それとも Matlab のpkstest2値が非常に悪いのでしょうか? 非常に悪いとは、それが間違って実装されているという疑いがあることを意味します。

ヘルプページにkstest2は、関数が漸近p値を計算すると記載されていますが、どのメソッドが正確に使用されているかについての参照は見つかりませんでした。とにかく、説明はさらに述べています:

漸近p値は、サンプル サイズが大きい場合に非常に正確になり、(n1*n2)/(n1 + n2) ≥ 4 のように、サンプル サイズ n1 および n2 の場合はかなり正確であると考えられます。


例 1

Lehman and D'Abrera (1975) の例 6 を見てみましょう。

(n1*n2)/(n1 + n2) = 4この場合、p値は適度に正確である必要があります。

p = 0.0497本で与えられた解決策は ですが、Matlab は をもたらし0.0870ます。ソリューションを検証するために、R を使用しました。R は、特に統計において、Matlab よりも信頼しています。

ks.testfromstatsパッケージとks.bootfromパッケージの使用Matching:

どちらも を与えp = 0.0870ます。


例 2

独自の例を使用kstest2して、サンプル サイズが大きい場合の Matlab と R の結果を比較してみましょう。

これにより が得られp = 0.0317ます。ここで、同じx1x2ベクトルを使用すると、R は を与えp = 0.03968ます。非常に正確な結果が期待される場合、約 20% の差(n1*n2)/(n1 + n2) = 25

私は行方不明ですか、何かを台無しにしていますか? 例が示すように、Matlab のkstest2パフォーマンスが非常に悪い可能性はありますか? アルゴリズムkstest2はどのような近似を使用していますか? (kstest2 に実装されたコードを見ることができますが、何が起こっているのかを理解するには、本や紙を参照する方がはるかに良いでしょう。)

Matlab 2016a を使用しています。


リーマンとダブレラ (1975)。ノンパラメトリック: ランクに基づく統計手法。第1版。スプリンガー。

0 投票する
1 に答える
380 参照

python - KS テスト用の非標準分布変数?

非標準の分布関数に scipy.stats の kstest を使用できますか (つまり、Student t の DOF を変更したり、Cauchy のガンマを変更したりします)。私の最終目標は、分布適合の最大 p 値と対応するパラメーターを見つけることですが、それは問題ではありません。

編集:

"

scipy.stat の cauchy pdf は次のとおりです。

x_0 = 0ここで、位置パラメーターとガンマを意味しますY = 1。私は実際にこのように見える必要があります

"

Q1) 学生は、少なくとも、次のような方法で使用できますか?

パラメータを変更するオプションがあるように見えるので?

Q2) 完全な正規分布方程式 (シグマを変化させる必要がある) と上記のコーシー (ガンマを変化させる必要がある) が必要な場合、これをどのように行いますか? 編集:scipy.stats非標準の分布を検索する代わりに、p 値を見つける kstest に書き込む関数を実際にフィードすることは可能ですか?

よろしくお願いします

0 投票する
1 に答える
3804 参照

r - R ggplot の kolmogorov-smirnov プロット

rでKSプロットを実行しようとしていますが、すべてうまくいっているようです.2つの異なるサンプルを視覚化するために色しか使用できず、線の種類を視覚化できないという事実を除いて.

私は次のことを試しました:

#試行 1

#試行 2

これは私が得るものです:

ここに画像の説明を入力

0 投票する
1 に答える
206 参照

r - コルモゴロフ・スミルノフ検定、D^- = 1

ks.test 出力の解釈について助けが必要です。サイコロを 3 つ振った 28 人の参加者がいます。Vektor g は、1 人あたりのロールの結果の合計を示します。

g を実際の分布関数と比較したい。次のコードを使用して、「真の」分布関数を生成しました。

次の ks.test は、正しくない 1 の D を生成します。

どこで間違いを犯したか教えてもらえますか?ご回答ありがとうございます。

0 投票する
1 に答える
180 参照

r - コルモゴロフ-スミルノフ検定は max(abs(difference(x, y))) とは異なる結果を与える

ks.testR の関数を使用して、コルモゴロフ-スミルノフ テストを実行しています。Kolmogorov-Smirnov 検定は、

Wikipediaの Kolmogorov-Smirnov Test の定義によると、結果は同等になるはずです。

誰でも理由を知っていますか?

0 投票する
1 に答える
663 参照

r - ラプラス分布 R の Kolmogorov-Smirnov 検定

R の ks 関数に問題があります。ラプラス分布があります。

したがって、ks テストを実行する必要がありますが、そこにあるはずの 2 番目のパラメーターについては何も見つかりません。

対数正規分布または:

物流配送用

ありがとう。

0 投票する
1 に答える
264 参照

statistics - SAS - コルモゴロフ-スミルノフ両側臨界値

両側 Kolmogorov-Smirnov 検定の臨界値を計算しようとしています ( PROC NPAR1WAYはこれらを出力しません!)。これは、c(a) * sqrt( (n+m)/(nm) ) として計算されます。ここで、n と m は各データセットの観測数で、c(a) = 1.36 で、信頼水準 a = 0.05 の場合です。

また、

A) これらを計算する SAS のルーチンはありますか? (しばらく探していました)または、

B) 自分で統計を計算する最良の方法は何ですか? 私の最初のアプローチは、各データセットから行数を選択してマクロ変数に入れ、統計を計算することですが、これは見苦しく感じます。

前もって感謝します