“hypothesis-test”の関連問題_Stack Overflow日本語サイト

0 投票する

3 に答える

19623 参照

r - R T-N / Mean/SDからのテスト

t.testデータセットがあれば、実行してT検定を実行できることを知っています。しかし、私は各セットのカウント、平均、標準偏差しか知りません。Rでこれを行う方法があるはずですが、私にはわかりません。何か助けはありますか？

r statistics hypothesis-test

2011-04-03T01:15:36.093

0 投票する

3 に答える

1686 参照

サンプルの大規模なデータセットを分析するために perl+R を使用しています。2 つのサンプルごとに、t 検定の p 値を計算します。現在、statistics::R モジュールを使用して perl から R に値をエクスポートし、t.test 関数を使用しています。ただし、このプロセスは非常に遅いです。同じ手順をより効率的な方法で実行する perl 関数を誰かが知っているかどうか疑問に思っていました。

ありがとう！

r perl statistics hypothesis-test

2012-01-22T11:39:16.113

0 投票する

4 に答える

4442 参照

r - 対応のあるt検定のクラッシュapply-loop（編集済み）

有益なコメントに応えて、私は元の質問を編集しました（forループとapplyループは異なる結果をもたらすと想定していました）。

Rを使用して、区切られたテーブルからの入力を使用して、多数の2グループt検定を実行しています。ここや他の場所からの推奨事項に従って、「for-loops」と「apply」のいずれかを試してそれを達成しました。'normal' t.testの場合、どちらもうまく機能し、同じ結果が得られます。ただし、対応のあるt検定の場合、for-lookは機能しているように見えますが、apply-loopは機能していません。後で、両方のループで同じ問題が発生することがわかりました（以下を参照）が、forループは状況をより適切に処理し（ループの1サイクルのみが無効な結果を返します）、apply-loopは完全に失敗します。

私の入力ファイルは次のようになります:(最初の行はヘッダー行で、データ行には名前があり、グループ1には4つのデータポイント、グループ2には4つのデータポイントがあります）：

など（全体で約50000行）。最初のデータ行（name19で始まる）が原因であることが判明しました。

これは、より適切に機能するforループバージョンです（問題のある行では失敗しますが、他のすべての行を正しく処理します）。

これは問題を引き起こす「適用」バージョンです

〜50000のデータラインの1つは、すべてのペアワイズ比較の差が同一であるという点で問題があります。これは、対応のあるt検定では、未定義のp値（本質的にゼロ）になります。適用ループがクラッシュし、「データは基本的に一定です」というエラーが発生します。私にとって（R初心者として）、t.testが1つのデータを好まないという理由だけで、スクリプト全体をクラッシュさせるのは良い考えではないようです。forループでは、このデータ行でもエラーメッセージが表示されますが、ループは続行され、他のすべてのt検定で正しい結果が得られます。

私は根本的に間違ったことをしましたか？この動作は、基本的に、この種のバッチ分析に適用ループを使用することを禁止します。または、この問題を回避するための標準的な方法はありますか。t検定が、ベイルアウトするのではなく、その特定のp値に対して無効なものを返さないのはなぜですか？

r hypothesis-test

2012-02-28T11:14:11.207

0 投票する

3 に答える

129000 参照

python - パンダでのT検定

パンダの2つのカテゴリの平均を計算したい場合は、次のように計算できます。

このようにフォーマットされたデータがたくさんあるので、 cat1とcat2の平均が統計的に異なるかどうかを確認するためにT検定を実行する必要があります。どうやってやるの？

python pandas scipy statistics hypothesis-test

2012-11-15T19:11:57.260

0 投票する

5 に答える

20621 参照

r - データフレームのt検定を実行するためのループを作成するにはどうすればよいですか？

データフレームに格納されている一部のデータに対してt検定を実行するという問題が発生しました。私はそれを一つずつ行う方法を知っていますが、まったく効率的ではありません。それを行うためのループの書き方を聞いてもいいですか？

たとえば、testDataにデータがあります。

2つの独立したグループ、つまり、いくつかの機能「F1」から「F11」の「良い」と「悪い」の各列に対してt検定を実行する必要があります。私は次のようなことをしようとしました：

そして、残りの「F2」から「F11」を実行しますが、明らかに効率的ではありません。ループで実行するためのより良いアイデアがあれば、本当に感謝しています。どうもありがとう。

r loops dataframe statistics hypothesis-test

2013-03-05T11:35:11.573

0 投票する

1 に答える

409 参照

matlab - 進化的アルゴリズムの比較における T 検定

2つの進化的アルゴリズムを実装しました。それぞれを 100 回試行します。

各試行の最終的な最高のフィットネス値を保存しました。

T-Test を使用して、各アルゴリズムの最終的な平均適合度を matlab と比較するにはどうすればよいですか?

アルゴリズムのパフォーマンスに有意な差があるかどうかを確認したいですか?

matlab hypothesis-test

2013-04-28T08:25:52.680

0 投票する

1 に答える

316 参照

python - ペアでのみt検定を実行するPython

こんにちは、私はこの関数を作成するために助けを得ましたが、今は非常に立ち往生しています。

list1 と list2 にあるすべての単語を見つける

ご覧のとおり、単語の頻度を含む 2 つのリストを比較しようとしていますが、一部の単語は両方のサンプルサイズに表示されません。各単語ペアに対して t 検定を実行して、それらの分散を判断したいと考えています。ただし、これにより、同じ t 値と p 値のペアが何度も返されます。

アイデアはありますか？

サンプルファイルは次のようになります: count-pos.txt

python hypothesis-test

2013-06-06T16:02:07.050

0 投票する

3 に答える

24650 参照

r - t検定のエラー

通常の t 検定でエラーが発生しました。

エラー：

ベクトルの何が問題なのか理解できません。教えてください。私はそれを理解することができませんでした。

r bioinformatics hypothesis-test

2013-08-06T08:39:06.230

問題タブ [hypothesis-test]

r - R T-N / Mean/SDからのテスト

r - 高速 perl t-test 関数

r - 対応のあるt検定のクラッシュapply-loop（編集済み）

python - パンダでのT検定

r - データフレームのt検定を実行するためのループを作成するにはどうすればよいですか？

matlab - 進化的アルゴリズムの比較における T 検定

python - ペアでのみt検定を実行するPython

r - t検定のエラー

問題タブ [hypothesis-test]

Reference