問題タブ [p-value]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - マンホイットニー U 検定
異なる処理後の遺伝子発現を比較する必要がある数千のサンプルを含む csv があります。
Mann Whitneyの u 検定を行うように依頼されましたが、これを使用すると R から結果が得られます。
ただし、0.1 や 0.5 などの値しか取得できません。
追加するalternative ="greater"
と、0.35000 または 0.05000 のような値が得られ、いくつかのサンプルでは 0.14314 のような pvalue が得られました (これは私が問題ない値です)。ですから、なぜ R がこのような奇妙な pvalue (0.35000,..) を与えているのか、それを修正して「通常の」pvalue を取得する方法を知りたいと思っています。
r - R の小さな p 値の無限大に丸められた Z スコア
私は、1E-30 から 1 の範囲の p 値を持つゲノム全体の関連研究データセットを使用しています。p 値の変数「p」を含む R データフレーム「データ」があります。
次のコードを使用して、p 値のゲノム補正を実行する必要があります。
2 行目のコマンドでは、qchisq 関数を使用して p 値を z スコアに変換しています。p 値 < 1E-16 の z スコアは無限大に丸められています。これは、最も重要なデータ ポイントの p 値がゲノム補正後に 0 に丸められ、ランキングが失われることを意味します。
これを回避する方法はありますか?
r - Tukey HSD ペアごとの p 値をテーブルに表示する
因子レベルが 10 のデータに対してポストホック Tukey HSD を実行しています。この表は巨大であり、p 値をペアごとの表で読者に提示することを望んでいました。45 行の表は付録に残しておきます。
データセットの例を次に示します。
結果は、45 行のテーブルです。代わりに、行と列の名前として因子レベルを持ち、セルに p 値があり、2 つが有意に異なるかどうかを示すテーブルが必要です。X やアンダースコアなど、繰り返しまたは不必要な比較を表す可能性のあるもの。このようなもの:
等々。
このような表を自動的に作成する方法はありますか?
r - R を使用して、複数のフィッシャーの正確なテスト p 値を順番に見つける
Rでフィッシャーの正確なテストを使用するためのp値を見つけたい5000を超えるデータセットがあります。それらはcsvファイルに保存され、次のようになります。
ここで、各行は分割表を表します。今、私は一度に分割表を作成しなければなりませんが、それには永遠に時間がかかります。
これまでこのコードを使用しました alltables<-read.table("untitled1.csv") ##データを読み取るために apply(alltables,1, function(x) fisher.test(matrix(x,nr=2))$p 。価値)
しかし、「fisher.test(matrix(x, nr = 2)) のエラー: 'x' には少なくとも 2 つの行と列が必要です」というエラーが表示されます。
p-value - lmerTest を使用して lmer の p 値を取得できませんでした
lmerTest
を使用して次のモデルを実行しましたlme4
。
コマンドを入力するlmerTest
と、次のエラーが表示されます。summary()
これはすでに他のユーザーの問題であり、1 人のユーザーが実行中の問題を回避できたことがわかりましたlsmeans()
。lsmeans を試したところ、次のエラーが発生しました。
共分散行列を調べると、NA は見当たりませんでした。グループ因子のコントラストを逆にするだけで、このモデルを実行できることに注意してください。なぜそうなのか理解に苦しむ。
lmerTest ではなく lme4 を使用して同じモデルを実行すると、summary() のすべての出力を取得できますが、p 値は取得できません (予想どおり)。pvals.fnc は lme4 で廃止されました。私はまだ代替手段を見つけていません。さらに、lmerTest をうまく使用できた他のモデルと同じ方法で model2 の p 値を推定するとよいでしょう。
この時点で私が何をすべきか知っている人はいますか?どんな助けでも大歓迎です!
python - Pythonで相関係数の統計的差異を取得する
python で 2 つの配列間の相関関係を取得するために、次を使用しています。
ただし、ドキュメントに記載されているように、返される p 値はpearsonr()
500 を超えるデータセットでのみ意味があります。小さなデータセットに適した p 値を取得するにはどうすればよいですか?
私の一時的な解決策:
線形回帰について調べた後、基本的にフィッシャー変換を使用して z スコアを取得し、そこから p 値を計算する独自の小さなスクリプトを作成しました。
できます。ただし、 で与えられる p 値の方が妥当かどうかはわかりませんpearsonr()
。この機能を既に備えている Python モジュールはありますか? SciPyまたはStatsmodelsで見つけることができませんでした。
明確にするために編集します。
私の例のデータセットは単純化されています。私の実際のデータセットは、10 ~ 50 の値の 2 つの配列です。