問題タブ [chi-squared]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1586 参照

r - R 関数は Excel CHIINV と同じ

ExcelのCHIINVと同じことをする関数を探しています。Microsoft のドキュメントによると、CHIINV の定義は次のとおりです。カイ 2 乗分布の右側確率の逆数を返します。

たとえば、 =CHIINV(0.2,2)3.21 を返します。

R で見つけられる最も近い関数は geoR の dinvchisq ですが、

dinvchisq(0.2,2)1.026062 を返す

助けてください!

0 投票する
1 に答える
109 参照

c++ - ブーストを使用して確率をしきい値にマップする

カイ二乗分布に非中心性パラメーター ラムダがある特定のしきい値 t について、検出漏れの確率を計算する必要があります。

ブースト確率の面白さを理解しようとしましたが、これまでのところうまくいくものは思いつきませんでした。

ピックが t より下または上である確率を与えます。

p特定の確率をしきい値に逆マッピングするにはどうすればよいtですか?

0 投票する
1 に答える
6325 参照

r - カイ二乗分布 R

R で使用して chi_square 分布を当てはめようとしています。fitdistr()これに関するドキュメントはここにあります (私にはあまり役に立ちません): https://stat.ethz.ch/R-manual/R-devel/library/MASS/html/fitdistr. html

質問 1:chi_df以下の出力は次のとおりです 3.85546875 (0.07695236)。2番目の数字は何ですか?分散または標準偏差?

質問 2: fitdistrChi-SQ 分布によって定義される「k」を生成します。スケーリング定数「A」を取得するためにデータを適合させるにはどうすればよいですか? 以下の14〜17行目をばかげて使用しています。明らかに良くない。

質問 3: カイ二乗分布は特定の x 範囲に対してのみ定義されていますか? (分散は 2K として定義されますが、平均 = k です。これには、制約のある x 範囲が必要です...プログラミングではなく統計に関する質問...)

ご協力いただきありがとうございます!

0 投票する
1 に答える
1024 参照

r - このデータ テーブルを dplyr で要約し、結果に対して chisq.test (または同様のもの) を実行し、すべてを 1 つのきちんとした関数にループするにはどうすればよいでしょうか?

この質問は、私がここで尋ねた別の質問に埋め込まれていましたが、最初の問い合わせで知りたかったことの範囲を超えているため、別のスレッドに値する可能性があると考えました.

ここここで受け取った回答とKhashaaとJaapdplyrによって書かれた関数に基づいて、この問題の解決策を考え出そうとしています。

(特に Jaap から) 提供されたソリューションを使用して、受け取った生データをマトリックスのようなデータ テーブルにまとめることができました。

次のようになります

Typeは細菌の種類で、次の列はそれらが培養された場所を表します。数字は、それぞれの種類の細菌が検出された回数を表します。

私は最終的なテーブルがどのように見えるべきかを知っていますが、今までは各比較と変数に対して段階的にそれを行ってきdplyrました.これにSOで答えてください。

最終テーブルの例

最初のグループ化変数「創傷」は、続いて「尿」、「呼吸器」などに置き換えられます...そして、「すべて/合計」という名前の最後の列があります。これは、行の各変数の合計回数です「タイプ」を見つけて、病院 1 と 2 でまとめて比較しました。

私がこれまで行ってきたことは、次のような非常に面倒なことです。これは「手で」計算され、すべての結果を手動でテーブルに入力するためです。

生のdata.frameでパイプを実行するdplyrと、目的のテーブルの正確なフォーマットを取得できないことを理解していますが、少なくともここでのすべての手順を自動化し、結果を. .csv ファイルとしてエクスポートし、最終的な列の編集などを行うことができる最終的なテーブルですか?

どんな助けでも大歓迎です。

0 投票する
1 に答える
1418 参照

r - Rのカイ二乗検定で警告が生成されたときに、フィッシャーの正確検定「fisher.test()」を実行するにはどうすればよいですか?

という名前のRにデータフレームがありますdf。たまたま因子となるデータ フレーム内のすべての変数について、被験者の性別で階層化されたカイ 2 乗検定を実行し、結果の p 値を保存したいと考えています。以下に示すように、これを行うためのコードを作成しました。

問題は、このコードを実行すると、次のようになることです。

fisher.test()カイ二乗検定によって警告が生成されたときに、代わりにフィッシャーの正確検定を実行するように元のコードを変更するにはどうすればよいですか? 警告が発生したときにコードを認識させる方法がわかりません。ありがとう!

0 投票する
1 に答える
119 参照

r - この高階関数を R でループするにはどうすればよいでしょうか?

この質問は、 thelatemailからの素敵な小さな関数を使用して、ここで受け取った返信に関連しています。私が使用しているデータフレームは最適ではありませんが、それは私が持っているものであり、すべての行でこの関数をループしようとしています。

これは私のDFです

chisq.test私が持っている機能は、 のすべてのカテゴリにわたって実行することdf$Typeです。理想的には、細胞数が 5 未満の場合、関数は a に切り替える必要がありfisher.test()ますが、それは別の問題です (ただし、それを行う方法を思いついた人には追加のブラウニー ポイントがあります)。

これは、行ごとに移動するために使用している関数です

しかし、理想的には、私はそれがこのようなものであることを望んでいます

しかし、それはうまくいきません。さらなるフックは、たとえば行 2 が取得されると、final呼び出しが次のようになることです。

そのため、関数は、取得するセル数をout[x,]から除外する必要があることを理解する必要がありcolSums()ます。これdata.frameは3行しかないので簡単ですが、この関数を200行以上で構成される別のdata.frameに適用しようとしたので、これを何らかの方法でループできるといいでしょう。

どんな助けでも感謝します。

乾杯

0 投票する
0 に答える
165 参照

r - Chisq.test と適合度

この記事http://ccnmtl.columbia.edu/projects/qmss/the_chisquare_test/about_the_chisquare_test.html、特に適合度検定に関するセクションを読みました。昔ながらの方法でカイ 2 乗値を計算したところ、正しく (13.6) なりました。

いくつかの質問を聞きたいんです:

  1. 記事から: 「次に、上記の式で計算された値をテーブルの標準セットと比較します。テーブルから返される値は 1.8% です。」. これは、p 値で chisq.test によって返される値です。関数はどのように p 値を計算しますか?
  2. p 値は、さいころが公平である確率が 1.8% であることを示しています。これは、私が (100 - 1.8) 98.2% サイコロが不当であると確信していると言っているのと同じですか?
  3. 99% の信頼係数を渡す chisq.test() 関数を呼び出す方法はありますか?
  4. 最後に、実際の観測に対して chisq.test() 関数を使用する必要がありますか、それとも観測から派生した分割表に対して使用する必要がありますか?

あなたの助け/ポインタ/アドバイスをありがとう.

リチャード・ロジャース

0 投票する
1 に答える
299 参照

r - R、カイ 2 乗検定、2 次元ランダム ベクトル、適合度

サイズ $n$ のサンプル $x$ があり、$n$ は偶数です。$H_0$ は集合 $\{1,\dots,S\}$ 上の一様分布です。基本的に私はこれを行います:

その後、独立性のためではなく、フィット感の良さのためにカイ 2 乗検定を使用したいと思います。より正確には、ランダム変数 ${x_1,x_2,\ldots, x_n}$ のシーケンスがありましたが、今度はランダム ベクトル ${(x_1,x_2), (x_3,x_4), \ldots, (x_ {n-1}, x_n)}$ セット $\{1,\dots,S\}^2$ の一様分布について $H_0^*$ をテストしたいと思います。

Rhelpのchisq.test に関するページに少し混乱しています。上記のコード チャンクで作成された を使用して、カイ 2 乗検定を独立性の良さではなく (!) フィットの良さで処理するにはどうすればよいですか?table

それは...ですか

私が探しているものは何ですか?

0 投票する
1 に答える
1789 参照

python - scikitでカイ二乗特徴選択のスコアに対応する特徴名を取得する方法

特徴選択に Scikit を使用していますが、テキスト内のすべてのユニグラムのスコア値を取得したいと考えています。スコアを取得しましたが、これらを実際の機能名にマップするにはどうすればよいですか。

これで結果が得られますが、どの機能名がどのスコアにマップされているかを知るにはどうすればよいでしょうか?

0 投票する
2 に答える
921 参照

sas - SAS Proc Logistic Selection=スコア

SASでPROC LOGISTICプロシージャとオプションSELECTION = SCOREを使用しています。これにより、ロジスティック回帰モデルとそのカイ二乗値がほとんど得られません。私の質問は、どちらのモデルが優れているかということです - カイ二乗が小さいか大きいですか?