問題タブ [statistical-test]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Python scipy でコルモゴロフ スミルノフ テストを実装する
正規性をテストしたいN個の数値のデータセットがあります。scipy.stats にkstest 関数があることは知っています が、その使用方法と結果の解釈方法に関する例はありません。ここに詳しい人で、アドバイスをくれる人はいますか?
ドキュメントによると、kstest を使用すると、KS 検定統計量 D と p 値の 2 つの数値が返されます。p 値が有意水準 (たとえば 5%) より大きい場合、データが特定の分布に由来するという仮説を棄却することはできません。
正規分布から 10000 個のサンプルを抽出し、ガウス性をテストしてテストを実行すると、次のようになります。
次の出力が得られます。
(0.04957880905196102、8.9249710700788814e-22)
p 値は 5% 未満です。これは、データが正規分布しているという仮説を棄却できることを意味します。しかし、サンプルは正規分布から抽出されました!
誰かがここでの不一致を理解して説明できますか?
(正規性のテストでは、mu = 0 および sigma = 1 を想定していますか? もしそうなら、データがガウス分布であるが、異なる mu と sigma を使用していることをどのようにテストできますか?)
r - 明らかに異なる 2 つの分布の統計検定 (R) の選択
次のデータのリストには、それぞれ 10 個のサンプルがあります。値は、特定の分子の結合強度を示します。
私が示したいのは、「x」が「y」、「z」、および「w」と統計的に異なることです。Xを見ると、ゼロより大きい値(2.8、1.00、5.4など)が他よりも多くなっています。
t検定をしてみましたが、いずれもP値が高く有意差はありませんでした。
そのための適切なテストは何ですか?
以下は私のコードです:
java - R統計テストの結果をJavaで保存する方法
Java プログラムで R を使用しており、anova などの統計テストを使用する必要があります。
しかし、R の結果をファイルに保存して、後で Java で管理する方法がわかりません。
RCaller と rJava で R と Java を結合しようとしていますが、問題は R と Java の結合方法ではないと思います。
私に何ができるか知っている人はいますか?
例:
私はcsvファイルにこのデータセットを持っています:
そこで、R で次のコマンドを実行します。
結果は次のとおりです。
後で管理するためにこの結果を保存するにはどうすればよいですか?
java - Java で Smirnov テストを実行する
Java で Smirnov テストを実行して、2 つのデータ セットが同じディストリビューションからのものかどうかを確認しようとしています。ただし、「シンボルが見つかりません」というエラーが発生します。このエラーが発生しないようにスミルノフ テストを「作成」するにはどうすればよいですか?
normal-distribution - 整数の正規分布
ここで非常に興味深い問題に直面しています。これは、1 から 5 の範囲の整数 (1,2,3,4,5) で正規分布を作成することです。技術的には、正規分布の形をしたポアソン分布です。
私の質問: 上記のように分布を作成すると、丸めた正規分布の数値のプールを作成したため、正規性のテストが失敗します (p < 0.01)(Shapiro Wilk テスト、Kolomogorov Smirnov テスト)。
xRND<-round(rnorm(179,mean=2.9,sd=1)) table(xRND) xRND 0 1 2 3 4 5 6 2 14 41 67 45 9 1
正規分布の形状を確認するのに役立つテストはありますか?
よろしく、St.
python-2.7 - scipy.stats.anderson テストの重要な値
私scipy.stats.anderson()
は正規分布をテストしていました。私の検定分布は正規分布ではなかったため、teststatistic > 臨界値です。ただし、計算されたすべての臨界値を確認すると、p 値が減少すると臨界値が増加します。つまり、検定の重要度が高いほど (p 値が小さいほど)、重要な値が検定統計量に近くなります。私の意見では、これは逆であるべきです。Anderson Test とその Scipy での実装に詳しい人はいますか?
r - R で作成された Tukey-HSD 統計テストの図における信頼区間の意味
私は 5x2 クロス検証実験を行い、その後、以下に示すように、5 つの手法の 10 の精度をペアごとに比較する Tukey-HSD ペアごとの比較を行いました。
上の図は、次の R コマンドの後に生成されました。
私が知りたいのは、このグラフの 2 つの手法が 1 つの信頼区間だけで表されている理由です。
私が知っているのは、1 つの手法を 1 つの信頼区間で表すことができるということです。図で 1 つの信頼区間が 2 つの手法を表しているのはなぜですか? これは 2 つの信頼区間の減算ですか?
r - R のコルモゴロフ-スミルノフ検定
コルモゴロフ-スミルノフ検定を使用して、サンプルの正規性を検定しようとしました。これは私がしていることの小さな簡単な例です:
Rが私に与える結果は次のとおりです。
p 値は非常に低いですが、検定では帰無仮説を受け入れる必要があります。
なぜ機能しないのかわかりません。
r - Rでコルモゴロフ・スミルノフを書く方法
簡単に言えば、R で ks.test() を使用する代わりに、Kolmogorov-Smirnov の 1 サンプル統計のコードを手動で記述したいと考えています。私の理解では、KS テストは基本的に分子と分母の比率です。私は分子を書き出すことに興味があり、私が理解していることから、それは観察のサンプルと理論的仮定の間の最大絶対差です。例として、以下のケースを使用してみましょう。
ここでは、最大の絶対差 (データ - 期待値) を取得したいと考えています。
誰にもアイデアがありますか?必要に応じて、この質問を言い換えることができます。ありがとう!