問題タブ [hypothesis-test]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
633 参照

python - statsmodels t-test のデータフレームの変換

pandas/statsmodels で t 検定を実行して 2 つのグループ間のパフォーマンスの違いを比較しようとしていますが、statsmodels が (合理的な方法で) 使用できる方法でデータをフォーマットするのが困難です。

私のパンダのデータフレームは現在次のようになっています。

そして、t検定を実行するには、次のように治療ごとに整理されたデータが必要であることを理解しています。

このコードはほとんどトリックを行います:

しかし、印刷すると、パフォーマンス値ではなく、その処理が発生したインデックスを取得しているように見えます。

[おそらく?] 次のようなものにする必要があります。

このデータフレームを t 検定を実行できる形式に変換する最良の方法は何ですか?

0 投票する
3 に答える
1751 参照

matlab - 複数のクラスの T 検定 (>2)

次の文を読みました。

機能的 MRI データは、サンプル数に比べて高次元です (通常、1000 サンプルに対して 50000 ボクセル)。この設定では、機械学習アルゴリズムのパフォーマンスが低下する可能性があります。ただし、単純な統計テストは、ボクセルの数を減らすのに役立ちます。

スチューデントの t 検定 (scipy.stats.ttest_ind) は、2 つの分布が統計的に異なるかどうかを判断する単純な統計検定を実行します。2 つの異なる条件でボクセルの時系列を比較するために使用できます (この場合、家または顔が表示されている場合)。時系列分布が 2 つの条件で類似している場合、ボクセルは条件を識別するのにあまり関心がありません。

この検定は、2 つの時系列が同じ分布から引き出される確率を表す p 値を返します。p 値が低いほど、ボクセルの識別性が高くなります。

から: http://nilearn.github.io/building_blocks/manipulating_mr_images.html

この t 検定は 4 つのクラス (条件) にも適用できますか。

利用可能なこれのMatlab実装はありますか?

0 投票する
1 に答える
14889 参照

r - R での多重 T 検定

次のように、マトリックスに 94 個の変数 (サンプル + タンパク質 + グループ) と 172 個の観測値があります。

サンプルの一部はグループ 0 にあり、一部はグループ 1 にあります。t 検定を使用してグループ 0 と 1 の間に違いがあるかどうかをテストしたいのですが、すべてのタンパク質に対してそれを実行したいと考えています。申請書を使おうと思ったのですが、使い方がわかりません。また、名前は Protein1, protein2... ではありません。かなり長いので、すべてを記述する必要はありません。

また、マトリックス内の各タンパク質の p 値のみが必要です。次のようなものです。

または、p 値が 0.05/92 未満のものだけを見つけることができるように、似たようなものを作成します。


編集:

長い形式で作業を開始しましたが、これはもう問題ではありません:

0 投票する
1 に答える
1796 参照

r - R での多変量 KS テスト

したがって、ここで概説されているように、KS テストを実行して、dtwo データセットの分布に違いがあるかどうかを評価できます。

では、以下のデータを取ってみましょう

次に、var3 の結果に基づいて分離できます

これで、コルモゴロフ–スミルノフ検定を実行して、個々の変数の分布の違いを検定できます。

当然のことながら、違いは得られず、異なるデータセットが同じ分布から引き出されたと想定できます。これは、次の方法で視覚化できます。

しかし、ここで、 &の両方を一緒 に考えたときにvar3==0、 との間の分布がvar3==1異なるかどうかを検討したいと思います。複数の予測子がある場合にそのようなテストを実行する R パッケージはありますかvar1var2

同様の質問がここに提起されましたが、回答はありません

いくつかの文献があるようです: 例 1 例 2

しかし、Rにリンクされているものは何もないようです

0 投票する
1 に答える
816 参照

r - カスタム テーブル: SPSS はどのようにマルチ レスポンス セットをカテゴリ変数とは異なる方法で処理しますか?

SPSS は、カスタム テーブルの z 検定に関しては、複数回答セットをカテゴリ変数とは異なる方法で扱います。この動作は、応答の重複に関連していると思いますが、その方法がわかりません。

では、多重応答セット (MRset) に関して、SPSS はどのように z 検定を行うのでしょうか?

私の目標は、R で MRsets の SPSS z-test を再現することですが、SPSS が実際に何をするのかわかりません。通常、SPSS カスタム テーブルの z-testing は、

しかし、明らかに MRsets の場合は異なります。

これを明確にするために、このカテゴリ対 MRset の比較を見てください。


カテゴリ変量 z 検定 (C 列と D 列は z 検定によると違いはありません)


MRset z-test (表の数値は同じですが、z-test の結果は異なります: C 列と D 列に有意差があります)


MRset R コードからわかるように、オーバーラップ ケースを差し引いても役に立ちません。多分それは重み付けか何かにリンクされていますか?アイデアをどうもありがとう。

おそらく役立つリンク:重みと多重応答セットに関する注意事項

0 投票する
1 に答える
22606 参照

python - Python での t 検定の信頼区間 (平均間の差)

平均間の差についてPythonでt検定の信頼区間を取得する簡単な方法を探しています。Rでこれに似ています:

外:

次:

仮説検定における有意区間の重要性 (および p 値のみを報告する慣行が最近受けた批判の量) を考慮すると、奇妙なことに、statsmodels または scipy のいずれかで似たようなものは実際には見つかりません。

0 投票する
1 に答える
1978 参照

r - Rのwald.testで仮説を渡す

私はこのフォーラムに不慣れなため、ご容赦ください。この調査では、係数の合計 = 0 を確認する必要があります。このテストは、c(2)+c(3)+c(4)=0 のような eview を使用して実行できます。ここで、2 は第 2 項の係数であり、以降も同様です。Rを使用した同じコードは

これによりエラーが発生します: wald.test(b = coef(object = output), Sigma = vcov(object = output) のエラー: テストされた係数のベクトルと帰無仮説のベクトルの長さが異なります。 aod パッケージに従って、ドキュメントではフォーマット

このテストの実施にご協力ください。