問題タブ [hypothesis-test]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
3 に答える
19623 参照

r - R T-N / Mean/SDからのテスト

t.testデータセットがあれば、実行してT検定を実行できることを知っています。しかし、私は各セットのカウント、平均、標準偏差しか知りません。Rでこれを行う方法があるはずですが、私にはわかりません。何か助けはありますか?

0 投票する
3 に答える
1686 参照

r - 高速 perl t-test 関数

サンプルの大規模なデータセットを分析するために perl+R を使用しています。2 つのサンプルごとに、t 検定の p 値を計算します。現在、statistics::R モジュールを使用して perl から R に値をエクスポートし、t.test 関数を使用しています。ただし、このプロセスは非常に遅いです。同じ手順をより効率的な方法で実行する perl 関数を誰かが知っているかどうか疑問に思っていました。

ありがとう!

0 投票する
4 に答える
4442 参照

r - 対応のあるt検定のクラッシュapply-loop(編集済み)

有益なコメントに応えて、私は元の質問を編集しました(forループとapplyループは異なる結果をもたらすと想定していました)。

Rを使用して、区切られたテーブルからの入力を使用して、多数の2グループt検定を実行しています。ここや他の場所からの推奨事項に従って、「for-loops」と「apply」のいずれかを試してそれを達成しました。'normal' t.testの場合、どちらもうまく機能し、同じ結果が得られます。ただし、対応のあるt検定の場合、for-lookは機能しているように見えますが、apply-loopは機能していません。後で、両方のループで同じ問題が発生することがわかりました(以下を参照)が、forループは状況をより適切に処理し(ループの1サイクルのみが無効な結果を返します)、apply-loopは完全に失敗します。

私の入力ファイルは次のようになります:(最初の行はヘッダー行で、データ行には名前があり、グループ1には4つのデータポイント、グループ2には4つのデータポイントがあります):

など(全体で約50000行)。最初のデータ行(name19で始まる)が原因であることが判明しました。

これは、より適切に機能するforループバージョンです(問題のある行では失敗しますが、他のすべての行を正しく処理します)。

これは問題を引き起こす「適用」バージョンです

〜50000のデータラインの1つは、すべてのペアワイズ比較の差が同一であるという点で問題があります。これは、対応のあるt検定では、未定義のp値(本質的にゼロ)になります。適用ループがクラッシュし、「データは基本的に一定です」というエラーが発生します。私にとって(R初心者として)、t.testが1つのデータを好まないという理由だけで、スクリプト全体をクラッシュさせるのは良い考えではないようです。forループでは、このデータ行でもエラーメッセージが表示されますが、ループは続行され、他のすべてのt検定で正しい結果が得られます。

私は根本的に間違ったことをしましたか?この動作は、基本的に、この種のバッチ分析に適用ループを使用することを禁止します。または、この問題を回避するための標準的な方法はありますか。t検定が、ベイルアウトするのではなく、その特定のp値に対して無効なものを返さないのはなぜですか?

0 投票する
3 に答える
129000 参照

python - パンダでのT検定

パンダの2つのカテゴリの平均を計算したい場合は、次のように計算できます。

このようにフォーマットされたデータがたくさんあるので、 cat1cat2の平均が統計的に異なるかどうかを確認するためにT検定を実行する必要があります。どうやってやるの?

0 投票する
5 に答える
20621 参照

r - データフレームのt検定を実行するためのループを作成するにはどうすればよいですか?

データフレームに格納されている一部のデータに対してt検定を実行するという問題が発生しました。私はそれを一つずつ行う方法を知っていますが、まったく効率的ではありません。それを行うためのループの書き方を聞いてもいいですか?

たとえば、testDataにデータがあります。

2つの独立したグループ、つまり、いくつかの機能「F1」から「F11」の「良い」と「悪い」の各列に対してt検定を実行する必要があります。私は次のようなことをしようとしました:

そして、残りの「F2」から「F11」を実行しますが、明らかに効率的ではありません。ループで実行するためのより良いアイデアがあれば、本当に感謝しています。どうもありがとう。

0 投票する
1 に答える
409 参照

matlab - 進化的アルゴリズムの比較における T 検定

2つの進化的アルゴリズムを実装しました。それぞれを 100 回試行します。

各試行の最終的な最高のフィットネス値を保存しました。

T-Test を使用して、各アルゴリズムの最終的な平均適合度を matlab と比較するにはどうすればよいですか?

アルゴリズムのパフォーマンスに有意な差があるかどうかを確認したいですか?

0 投票する
1 に答える
316 参照

python - ペアでのみt検定を実行するPython

こんにちは、私はこの関数を作成するために助けを得ましたが、今は非常に立ち往生しています。

list1 と list2 にあるすべての単語を見つける

ご覧のとおり、単語の頻度を含む 2 つのリストを比較しようとしていますが、一部の単語は両方のサンプル サイズに表示されません。各単語ペアに対して t 検定を実行して、それらの分散を判断したいと考えています。ただし、これにより、同じ t 値と p 値のペアが何度も返されます。

アイデアはありますか?

サンプル ファイルは次のようになります: count-pos.txt

0 投票する
3 に答える
24650 参照

r - t検定のエラー

通常の t 検定でエラーが発生しました。

エラー:

ベクトルの何が問題なのか理解できません。教えてください。私はそれを理解することができませんでした。

0 投票する
0 に答える
211 参照

r - T検定と順列検定

このようなデータフレームがあります。2 つの個別のグループと 5 つの異なる変数があります。

T 検定を使用して 2 つのグループを区別するために、各変数の有意性を計算しています (以下を参照)。ただし、これは非常に小さなデータセットであるため、順列テストを実装して p 値を計算したいと思います。Rでこれを行うための最良の方法は何ですか?

0 投票する
1 に答える
800 参照

r - R での wilcox.test の高速化

私は現在、1 つの大きな行列に結合した複数のデータ セットに Wilcoxon ランクサム テストを実装しようとしています。Aつまり、ランクサム テスト時間705x17635を実行したいのです。 17,635for ループの使用はlapplyであり、次のように実行しました。

ここで、bはネガティブ コントロール データで、 は20000x1ベクトルです。ただし、これを実行するには非常に時間がかかります (私は 30 分後にあきらめました)。これを実行するためのより迅速な方法があるかどうか疑問に思っています。分ですが、さまざまな理由で R を使用する必要があります。