問題タブ [chi-squared]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
615 参照

python - マルチパラメータ カイ 2 乗がエラー ループに陥るのはなぜですか?

Python でモジュールを使用してマルチパラメーター フィットを実行しようとしていlmfitますが、一部のパラメーター グループの合計が 1 になるという制約があります。

たとえば、カイ二乗にパラメーター B1_0 と B1_1 があるとします。params.add('B1_0', value=0.5, min=0, max=1)最初とparams.add('B1_1', expr='1-B1_0-B1_2') 2 番目のパラメーターを設定します。次に、この方法を使用してminimize、モデルのデータへの最適な適合を見つけることができます。

私のコードでは、これは単純ではありません。適合する自動生成パラメータが多数あるため、次のような方法を使用します。

メソッドgetValue(term)は、カイ二乗を最小化することが知られている別のフィッティング メソッドからの値を返します。コードを実行しようとすると、次のようなエラー メッセージが表示されます。

... ... など、次で終了します。

このフィットで lmfit がエラーをスローする理由がわかりません。誰にもアイデアはありますか?制約なしで「機能」しますが、使用できない結果が得られます。

0 投票する
0 に答える
1680 参照

statistics - 圧縮/暗号化データのエントロピーとバイト分布の比較

しばらくの間、自分自身を占めるいくつかの質問があります。

エントロピーテストは、暗号化されたデータを識別するためによく使用されます。分析されたデータのバイトが均一に分散されると、エントロピーは最大に達します。エントロピーテストを使用すると暗号化されたものとして分類される圧縮データのように、このデータは均一に分布しているため、エントロピーテストは暗号化されたデータを識別します。

例:一部のJPGファイルのエントロピーは7,9961532ビット/バイトであり、一部のTrueCrypt-containerのエントロピーは7,9998857です。これは、エントロピーテストでは、暗号化されたデータと圧縮されたデータの違いを検出できないことを意味します。しかし、最初の画像でわかるように、明らかにJPGファイルのバイトは均一に分散されていません(少なくともtruecrypt-containerからのバイトほど均一ではありません)。

別のテストは、頻度分析です。各バイトの分布が測定され、たとえばカイ二乗検定が実行されて、分布が仮想分布と比較されます。その結果、p値が得られます。JPGとTrueCrypt-dataでこのテストを実行すると、結果が異なります。

JPGファイルのp値は0です。これは、統計ビューからの分布が均一ではないことを意味します。TrueCryptファイルのp値は0.95です。これは、分布がほぼ完全に均一であることを意味します。

今の私の質問:エントロピーテストがなぜこのような誤検知を生成するのか誰かに教えてもらえますか?情報量が表現される単位のスケール(バイトあたりのビット数)ですか?たとえば、スケールが細かいため、p値ははるかに優れた「単位」ですか?

回答/アイデアをありがとうございました!

編集:残念ながら、まだ10の評判を得ていないため、画像を投稿できません:(

0 投票する
1 に答える
96 参照

python - 関数の最小化中にパラメーターが「1になる」ことを保証する方法

PyMinuitを使用して、いくつかのパラメーターを合計して1にする必要がある最小化を実行しようとしています。このようなことを実装する標準的な方法があるのだろうか?

制約が満たされていない場合、関数を大きな値に設定するのが通常ですか?例えば

ラウンドごとにパラメーターを正規化することは非常に悪い考えですか?例えば

ありがとう!

0 投票する
1 に答える
1538 参照

r - データが観測値のリストである場合の R のカイ二乗検定

データが観測値のリストの形式である場合、 Rでカイ 2 乗を計算することは可能ですか? 私が言いたいのは、十字架を知っていればカイ二乗を求めるのは簡単だということです。たとえば、アンケートで性別と正誤問題を尋ねた場合、カイ 2 乗を計算するのに必要な数字は 4 つだけです。私が代わりに持っているのは、各回答者の回答を含む 2 列のデータです。このデータ構造からカイ 2 乗を求めることは可能ですか、それとも変換する必要がありますか?

Rに変換する必要がある場合、カイ二乗を直接取得できる別の言語を知っている人はいますか?

0 投票する
6 に答える
12330 参照

java - JAVA から R を呼び出して、カイ 2 乗統計量と p 値を取得します。

JAVA には 2 つの 4*4 マトリックスがあり、1 つのマトリックスには観測されたカウントが保持され、もう 1 つのマトリックスには期待されるカウントが保持されます。

これら 2 つの行列間のカイ 2 乗統計量から p 値を自動的に計算する方法が必要です。しかし、私が知る限り、JAVA にはそのような機能はありません。

カイ 2 乗とその p 値を計算するには、2 つの行列を .csv ファイル形式として R に読み込み、次のように chisq.test 関数を使用します。

.csv ファイルの形式は次のようになります。

これらのコマンドを指定すると、R は次の形式の出力を返します。

これには、探していたp値が含まれています。

次のプロセスを自動化する効率的な方法を知っている人はいますか?

1) 行列を JAVA から .csv ファイルに出力する 2) .csv ファイルを R にアップロードする 3) .csv ファイルの chisq.test を R に呼び出す 4) 出力された p 値を Java に戻す?

助けてくれてありがとう....

0 投票する
2 に答える
1485 参照

java - Java と R の連携

double 配列を R に渡し、その値を合計して Java に返そうとしています。これが私がJavaでやろうとしていることです:

ただし、次のエラーが表示されます: import org.rosuda.JRI.REXP を解決できません import org.rosuda.JRI.Rengine を解決できません Rengine を型に解決できません

これは、私が行うインポートの場合でも当てはまります:

何かアドバイス?ありがとうございました!!

0 投票する
2 に答える
4159 参照

scikit-learn - Feature selection for multilabel classification (scikit-learn)

I'm trying to do a feature selection by chi-square method in scikit-learn (sklearn.feature_selection.SelectKBest). When I'm trying to apply this to a multilabel problem, I get this warning:

UserWarning: Duplicate scores. Result may depend on feature ordering.There are probably duplicate features, or you used a classification score for a regression task. warn("Duplicate scores. Result may depend on feature ordering."

Why is it appearning and how to properly apply feature selection is this case?

0 投票する
2 に答える
3336 参照

c# - C# で Excel の数式を使用する方法

C#でカイ二乗分布の右側確率を計算したいです。Excelは次のコードを使用してこの計算を行うことができます

ここで、100 はカイ 2 乗、4 は自由度です。

この関数を C# で計算に使用したい。「Microsoft.Office.Interop」への参照を追加しようとしましたが、使用方法が見つかりませんでした。

C# を使用して Excel で定式化を行い、結果を Excel で取得する方法についていくつかのトピックに出くわしましたが、残念ながらこれは私が必要としているものではありません。C# で計算を行い、C# で結果を取得する必要があります。

0 投票する
1 に答える
1428 参照

spss - SPSSで分割表を入力する

次の形式の分割表があります。

このデータを SPSS v21 に取り込めないので、分析できません (カイ 2 乗)。このようにデータを直接入力して、分析>記述統計>クロス集計を行ってみたのですが、分析結果が正しくなく、変なカテゴリに分かれてしまい、カイ二乗値が2になってしまいました。私は144.2を取得します。これを正しく入力する方法について誰かが意見を持っている場合は、大いに感謝します。ありがとう!