問題タブ [kolmogorov-smirnov]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - scipy.stats.kstest を使用した 2 標本コルモゴロフ–スミルノフ検定
scipy.stats.kstest を使用して、2 サンプルのコルモゴロフ–スミルノフを実行するかどうかをテストします。つまり、データの 2 つの列 (サンプル) が基になる母集団分布関数が異なるかどうかをテストします。kstest はこれを行うことができますか?
私の問題は、特定のサンプルを正規分布、t 分布などの既知の分布と比較するために kstest を使用する方法をドキュメントでしか見つけることができなかったことです。
python - 2 サンプル KS テスト - 何かが間違っているようです
データのヒストグラムが同じ分布からのものであるかどうかを判断するために、scipy の ks_2samp 関数を使用して Kolmogorov-Smirnoff テストを実行しようとしています。返された p 値は、時々正しくないように見えます...
たとえば、次のヒストグラムを使用します。
約 .96 の p 値が返されましたが、これは正しくないようです...何か間違っているのでしょうか? これらのヒストグラムは、p 値が低くなるのに十分なほど異なるべきではありませんか?
r - Matlab での 2 サンプル Kolmogorov-Smirnov テスト (kstest2) の実装が不十分ですか?
明らかな何かが欠けているのでしょうか、それとも Matlab のpkstest2
値が非常に悪いのでしょうか? 非常に悪いとは、それが間違って実装されているという疑いがあることを意味します。
ヘルプページにkstest2
は、関数が漸近p値を計算すると記載されていますが、どのメソッドが正確に使用されているかについての参照は見つかりませんでした。とにかく、説明はさらに述べています:
漸近p値は、サンプル サイズが大きい場合に非常に正確になり、(n1*n2)/(n1 + n2) ≥ 4 のように、サンプル サイズ n1 および n2 の場合はかなり正確であると考えられます。
例 1
Lehman and D'Abrera (1975) の例 6 を見てみましょう。
(n1*n2)/(n1 + n2) = 4
この場合、p値は適度に正確である必要があります。
p = 0.0497
本で与えられた解決策は ですが、Matlab は をもたらし0.0870
ます。ソリューションを検証するために、R を使用しました。R は、特に統計において、Matlab よりも信頼しています。
ks.test
fromstats
パッケージとks.boot
fromパッケージの使用Matching
:
どちらも を与えp = 0.0870
ます。
例 2
独自の例を使用kstest2
して、サンプル サイズが大きい場合の Matlab と R の結果を比較してみましょう。
これにより が得られp = 0.0317
ます。ここで、同じx1
とx2
ベクトルを使用すると、R は を与えp = 0.03968
ます。非常に正確な結果が期待される場合、約 20% の差(n1*n2)/(n1 + n2) = 25
。
私は行方不明ですか、何かを台無しにしていますか? 例が示すように、Matlab のkstest2
パフォーマンスが非常に悪い可能性はありますか? アルゴリズムkstest2
はどのような近似を使用していますか? (kstest2 に実装されたコードを見ることができますが、何が起こっているのかを理解するには、本や紙を参照する方がはるかに良いでしょう。)
Matlab 2016a を使用しています。
リーマンとダブレラ (1975)。ノンパラメトリック: ランクに基づく統計手法。第1版。スプリンガー。
python - KS テスト用の非標準分布変数?
非標準の分布関数に scipy.stats の kstest を使用できますか (つまり、Student t の DOF を変更したり、Cauchy のガンマを変更したりします)。私の最終目標は、分布適合の最大 p 値と対応するパラメーターを見つけることですが、それは問題ではありません。
編集:
"
scipy.stat の cauchy pdf は次のとおりです。
x_0 = 0
ここで、位置パラメーターとガンマを意味しますY = 1
。私は実際にこのように見える必要があります
"
Q1) 学生は、少なくとも、次のような方法で使用できますか?
パラメータを変更するオプションがあるように見えるので?
Q2) 完全な正規分布方程式 (シグマを変化させる必要がある) と上記のコーシー (ガンマを変化させる必要がある) が必要な場合、これをどのように行いますか? 編集:scipy.stats
非標準の分布を検索する代わりに、p 値を見つける kstest に書き込む関数を実際にフィードすることは可能ですか?
よろしくお願いします
r - コルモゴロフ・スミルノフ検定、D^- = 1
ks.test 出力の解釈について助けが必要です。サイコロを 3 つ振った 28 人の参加者がいます。Vektor g は、1 人あたりのロールの結果の合計を示します。
g を実際の分布関数と比較したい。次のコードを使用して、「真の」分布関数を生成しました。
次の ks.test は、正しくない 1 の D を生成します。
どこで間違いを犯したか教えてもらえますか?ご回答ありがとうございます。
r - コルモゴロフ-スミルノフ検定は max(abs(difference(x, y))) とは異なる結果を与える
ks.test
R の関数を使用して、コルモゴロフ-スミルノフ テストを実行しています。Kolmogorov-Smirnov 検定は、
Wikipediaの Kolmogorov-Smirnov Test の定義によると、結果は同等になるはずです。
誰でも理由を知っていますか?
r - ラプラス分布 R の Kolmogorov-Smirnov 検定
R の ks 関数に問題があります。ラプラス分布があります。
したがって、ks テストを実行する必要がありますが、そこにあるはずの 2 番目のパラメーターについては何も見つかりません。
対数正規分布または:
物流配送用
ありがとう。
statistics - SAS - コルモゴロフ-スミルノフ両側臨界値
両側 Kolmogorov-Smirnov 検定の臨界値を計算しようとしています ( PROC NPAR1WAYはこれらを出力しません!)。これは、c(a) * sqrt( (n+m)/(nm) ) として計算されます。ここで、n と m は各データセットの観測数で、c(a) = 1.36 で、信頼水準 a = 0.05 の場合です。
また、
A) これらを計算する SAS のルーチンはありますか? (しばらく探していました)または、
B) 自分で統計を計算する最良の方法は何ですか? 私の最初のアプローチは、各データセットから行数を選択してマクロ変数に入れ、統計を計算することですが、これは見苦しく感じます。
前もって感謝します