問題タブ [chi-squared]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 幾何分布のカイ二乗適合度
課題として、PMF を使用して特定の幾何分布のサンプルを開発し、アルゴリズム化して生成する必要がありました。
逆変換法を使用して、値を生成する次の式を思い付きました。
ここで、U はサンプルのサイズに応じて値または n 値を表し、Unif(0,1) 分布から抽出され、p は上記の PMF で述べたように 0.3 です。
私はアルゴリズム、R での実装を持っており、経験値の理論値 (R で生成) への調整を視覚的に評価するために QQ プロットを既に生成しています。つまり、生成されたサンプルが実際に幾何分布に従うかどうかです。
今、生成されたサンプルを適合度テスト、つまりカイ二乗に提出したかったのですが、Rでこれを行うのに問題があります.
matlab - MATLAB の chi2test -- 異なる長さのベクトル
3 つのグループ A、B、C の性別 (0 = 男性、1 = 女性) を表す 3 つのデータ ベクトルがあります。
例えば
および男女の相対数
3つのグループ間で性別に有意差があるかどうかを知りたい. これを行うには、使用できることを読みました
これを 2 つ以上のデータ グループと異なる長さのデータで使用するにはどうすればよいですか? 私のケースに合った MATLAB でカイ二乗検定を実行する他の方法はありますか?
前もって感謝します
r - R でサンプルをシミュレートし、それらを保存して、検定統計量を計算する
モンテカルロ アルゴリズムを使用して、反転サンプリングを使用して幾何分布のサイズ 100 のデータ サンプルを生成しました。
上記の関数は、幾何分布の CDF の逆関数です。
サイズ 100 の 1000 個のデータ サンプルをランダムにシミュレートし、各サンプルのカイ 2 乗検定統計量を計算する方法がわかりません。サンプルを作成する私の試みは次のとおりです。
}
ただし、これにより、後で参照する方法がなく、コンソールのすべてのサンプルが得られます。
助けていただければ幸いです。
ありがとうございました
python - Python scipy chisquare は R chisquare とは異なる値を返します
を使おうとしていますscipy.stats.chisquare
。おもちゃの例を作成しました:
R
戻り値の同じ例:
私は何を間違っていますか?
ありがとう
r - R: chisq.test で 99%
カイ二乗検定の信頼度を 95% から 99% に設定する方法はありますか?
ベース関数
chisq.test()
この機能に文句を言わないでください...
編集:
p値は求めません。私の質問は、信用リスクについてです。
chisq 検定のアルファ リスク (信頼度) は、デフォルトで 0.05 です。0.01(信頼度99%)に設定したいと思います。アルファ リスクは、統計 X のカットオフです。自由度が 'x' の特定のカイ分布の場合、アルファ リスクは「X リスク統計」に対応します。「データの X 統計量」が「X リスク統計量」より大きい場合、H0 を拒否します。H1 が真である確率として解釈できる p 値を計算できます。
信頼リスクを 0.05 から 0.01 に変更します。信頼リスクを変更すると、p 値が変更されます。たとえば、95% の信頼度で 0.001 の p 値は、99% の信頼度で 0.2 になる可能性があります。
python - Pandas: 行と列の和の外積
Pandas では、手動でカイ 2 乗検定をコーディングしようとしています。以下のデータフレームと比較row 0
しrow 1
ています。
このために、各セルの予想されるセル数を次のように計算する必要がありますcell(i,j) = rowSum(i)*colSum(j) / sumAll
。R では、outer()
積を取るだけでこれを行うことができます。
numpy の外積関数を使用して、上記の R コードの結果を模倣しました。
Pandas関数でこれを達成することは可能ですか?