問題タブ [kolmogorov-smirnov]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
64736 参照

r - R のコルモゴロフ-スミルノフ検定

コルモゴロフ-スミルノフ検定を使用して、サンプルの正規性を検定しようとしました。これは私がしていることの小さな簡単な例です:

Rが私に与える結果は次のとおりです。

p 値は非常に低いですが、検定では帰無仮説を受け入れる必要があります。

なぜ機能しないのかわかりません。

0 投票する
1 に答える
554 参照

statistics - Kolmogorov-Smirnov 検定における仮説検定 - 臨界値か p 値か

私は統計が初めてです。1 つのサンプル コルモゴロフ-スミルノフ テストを試しています。D maxまで見つけることができました。しかし、仮説検定を進めようか迷っています。

仮説を決定するために、先に進む必要があります-

テーブルからの重要な値

検定統計量 D が表から取得した臨界値より大きい場合は棄却

また

KS Statustic 値の p 値。

どっちがいいですか?p値の方がいいと読んでください。この中でkstest は、検定統計量 ksstat を臨界値 cv と比較するのではなく、p 値 p を有意水準 Alpha と比較することによって、帰無仮説を棄却することを決定します。cv は近似値であるため、ksstat と cv を比較すると、次の結果が得られることがあります。 p を Alpha と比較するのとは異なる結論です。

しかし、同じことに関する方程式は見つかりませんでした。

参照

上記の参考文献では、D max を p 値として取っているかどうかは疑問です。

ご意見をお聞かせください

0 投票する
2 に答える
3470 参照

python - 学生の t 分布を使用して Python で KS テストを実行するときに使用する引数は何ですか?

星の金属量に関するデータがあり、学生の t 分布と比較したい。これを行うために、python で scipy.stats.kstest を使用してコルモゴロフ-スミルノフ テストを実行して KSstudentst = scipy.stats.kstest(data,"t",args=(a,b)) いますが、引数がどうあるべきかを見つけることができません。学生の t には自由度 (df) パラメーターが必要ですが、他のパラメーターは何ですか。また、2つのうちのどちらがdfパラメーターですか。scipy.stats.t.cdf のドキュメントでは、入力は値が計算される位置と df ですが、KS テストでは位置を指定しても意味がありません。

0 投票する
1 に答える
2006 参照

python - scipy.stats.kstest を使用した 2 標本コルモゴロフ–スミルノフ検定

scipy.stats.kstest を使用して、2 サンプルのコルモゴロフ–スミルノフを実行するかどうかをテストします。つまり、データの 2 つの列 (サンプル) が基になる母集団分布関数が異なるかどうかをテストします。kstest はこれを行うことができますか?

私の問題は、特定のサンプルを正規分布、t 分布などの既知の分布と比較するために kstest を使用する方法をドキュメントでしか見つけることができなかったことです。

0 投票する
1 に答える
642 参照

python - 2 サンプル KS テスト - 何かが間違っているようです

データのヒストグラムが同じ分布からのものであるかどうかを判断するために、scipy の ks_2samp 関数を使用して Kolmogorov-Smirnoff テストを実行しようとしています。返された p 値は、時々正しくないように見えます...

たとえば、次のヒストグラムを使用します。

ヒストグラム.jpg

約 .96 の p 値が返されましたが、これは正しくないようです...何か間違っているのでしょうか? これらのヒストグラムは、p 値が低くなるのに十分なほど異なるべきではありませんか?

0 投票する
1 に答える
1551 参照

r - Matlab での 2 サンプル Kolmogorov-Smirnov テスト (kstest2) の実装が不十分ですか?

明らかな何かが欠けているのでしょうか、それとも Matlab のpkstest2値が非常に悪いのでしょうか? 非常に悪いとは、それが間違って実装されているという疑いがあることを意味します。

ヘルプページにkstest2は、関数が漸近p値を計算すると記載されていますが、どのメソッドが正確に使用されているかについての参照は見つかりませんでした。とにかく、説明はさらに述べています:

漸近p値は、サンプル サイズが大きい場合に非常に正確になり、(n1*n2)/(n1 + n2) ≥ 4 のように、サンプル サイズ n1 および n2 の場合はかなり正確であると考えられます。


例 1

Lehman and D'Abrera (1975) の例 6 を見てみましょう。

(n1*n2)/(n1 + n2) = 4この場合、p値は適度に正確である必要があります。

p = 0.0497本で与えられた解決策は ですが、Matlab は をもたらし0.0870ます。ソリューションを検証するために、R を使用しました。R は、特に統計において、Matlab よりも信頼しています。

ks.testfromstatsパッケージとks.bootfromパッケージの使用Matching:

どちらも を与えp = 0.0870ます。


例 2

独自の例を使用kstest2して、サンプル サイズが大きい場合の Matlab と R の結果を比較してみましょう。

これにより が得られp = 0.0317ます。ここで、同じx1x2ベクトルを使用すると、R は を与えp = 0.03968ます。非常に正確な結果が期待される場合、約 20% の差(n1*n2)/(n1 + n2) = 25

私は行方不明ですか、何かを台無しにしていますか? 例が示すように、Matlab のkstest2パフォーマンスが非常に悪い可能性はありますか? アルゴリズムkstest2はどのような近似を使用していますか? (kstest2 に実装されたコードを見ることができますが、何が起こっているのかを理解するには、本や紙を参照する方がはるかに良いでしょう。)

Matlab 2016a を使用しています。


リーマンとダブレラ (1975)。ノンパラメトリック: ランクに基づく統計手法。第1版。スプリンガー。

0 投票する
1 に答える
380 参照

python - KS テスト用の非標準分布変数?

非標準の分布関数に scipy.stats の kstest を使用できますか (つまり、Student t の DOF を変更したり、Cauchy のガンマを変更したりします)。私の最終目標は、分布適合の最大 p 値と対応するパラメーターを見つけることですが、それは問題ではありません。

編集:

"

scipy.stat の cauchy pdf は次のとおりです。

x_0 = 0ここで、位置パラメーターとガンマを意味しますY = 1。私は実際にこのように見える必要があります

"

Q1) 学生は、少なくとも、次のような方法で使用できますか?

パラメータを変更するオプションがあるように見えるので?

Q2) 完全な正規分布方程式 (シグマを変化させる必要がある) と上記のコーシー (ガンマを変化させる必要がある) が必要な場合、これをどのように行いますか? 編集:scipy.stats非標準の分布を検索する代わりに、p 値を見つける kstest に書き込む関数を実際にフィードすることは可能ですか?

よろしくお願いします

0 投票する
1 に答える
3804 参照

r - R ggplot の kolmogorov-smirnov プロット

rでKSプロットを実行しようとしていますが、すべてうまくいっているようです.2つの異なるサンプルを視覚化するために色しか使用できず、線の種類を視覚化できないという事実を除いて.

私は次のことを試しました:

#試行 1

#試行 2

これは私が得るものです:

ここに画像の説明を入力

0 投票する
1 に答える
206 参照

r - コルモゴロフ・スミルノフ検定、D^- = 1

ks.test 出力の解釈について助けが必要です。サイコロを 3 つ振った 28 人の参加者がいます。Vektor g は、1 人あたりのロールの結果の合計を示します。

g を実際の分布関数と比較したい。次のコードを使用して、「真の」分布関数を生成しました。

次の ks.test は、正しくない 1 の D を生成します。

どこで間違いを犯したか教えてもらえますか?ご回答ありがとうございます。

0 投票する
1 に答える
180 参照

r - コルモゴロフ-スミルノフ検定は max(abs(difference(x, y))) とは異なる結果を与える

ks.testR の関数を使用して、コルモゴロフ-スミルノフ テストを実行しています。Kolmogorov-Smirnov 検定は、

Wikipediaの Kolmogorov-Smirnov Test の定義によると、結果は同等になるはずです。

誰でも理由を知っていますか?