問題タブ [sample-size]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
3 に答える
18495 参照

r - r の計算に使用されるサンプル サイズをどのように見つけますか?

変数間の相関関係を実行していますが、その一部にはデータが欠落しているため、各相関関係のサンプル サイズは異なる可能性があります。印刷と要約を試みましたが、どちらも相関ごとに n がどれだけ大きいかを示していません。これは、どこにも答えが見つからない、かなり単純な問題です。

0 投票する
1 に答える
9426 参照

r - SASのprocpowerの実行可能な代替手段としてのrのサンプルサイズと検出力の計算?

したがって、サンプルサイズの計算(サンプルサイズが等しくない2つのサンプルに依存しない比率の場合)が、SASのprocpowerとrのいくつかのサンプルサイズ関数の間でどれほど近いかを確認しようとしています。私はUCLAのウェブサイトでここにあるデータを使用しています。

UCLAサイトは、次のようにパラメーターを提供します。

p1 = .3、p2 = .15、power = .8、null Difference = 0であり、両側検定の場合、サンプルサイズが等しいと仮定します。

不均等なサンプルサイズのテストの場合、パラメーターは同じで、グループの重みはグループ1の場合は1、グループ2の場合は2であり、実行するテストは片側です。

r関数を使用しています

pwrパッケージから。

したがって、UCLAサイトの最初の例のようにパラメーターの選択を入力すると、次のエラーが発生します。

これは、rが差を検出できないためと思われます。d = .5に設定すると、実行されました。SASは、差が小さすぎる場合にもエラーを出しますか?nullの差もゼロであるため、この例には含まれていません。

使用すると上記のエラーも発生します

私はひどく間違ったことをしているかもしれませんが、仮定された差が0である場合、私は本当に方法を見つけることができないようです。

SASとrは電力の計算に異なる方法を使用していることを理解しているので、同じ結果が得られるとは期待できません。私は実際に、rでprocpowerの結果を複製できるかどうかを確認しようとしています。

最初の例では、サンプルサイズが等しく、両側の代替案を使用して、ほぼ同じ結果を得ることができました。

Hmiscパッケージから。しかし、サンプルサイズが等しくない片側テストを行う場合、それらを再現することはできません。

等しくないグループサイズの片側サンプルサイズ計算のためにrのプロセスを複製する方法はありますか?

乾杯。

0 投票する
1 に答える
15185 参照

machine-learning - ランダム フォレスト実行時の最小観測数

非常に小さなデータセットに RandomForests を適用することは可能ですか? 多くの変数を持つデータセットがありますが、それぞれ 25 個の観測しかありません。ランダム フォレストでは、OOB エラーが少なく (10 ~ 25%)、妥当な結果が得られます。使用する観測の最小数に関する経験則はありますか? 実際、応答変数の 1 つが不均衡であり、それをサブサンプリングすると、観測数がさらに少なくなります。前もって感謝します

0 投票する
0 に答える
251 参照

machine-learning - 回帰か分類か? サンプルサイズを決定する方法は?

それぞれ n 個の機能 (数値) を持つインスタンスのグループがあります。X タイム ステップごとにフィーチャをリサンプリングしているため、各インスタンスには t1:tn に一連のフィーチャがあります。連続応答変数 (たとえば、範囲 50:100) は、X*z 回ごとにのみ測定されます。(例: 1 分ごとにサンプリングし、30 分ごとにのみ応答) 機能は時間の経過とともに変化する可能性があります。レスポンスもそうかもしれません。

ここで、いつでも T i は新しいインスタンスを応答範囲にマップしたいと考えています。

私がまだあなたを失っていない場合に備えて:-)これを回帰または多クラス分類の問題(離散化された応答範囲を伴う)と見なしますか?どちらの場合でも、必要なインスタンスの数は経験則ですか? インスタンスが同じ分布に従っていない場合 (たとえば、同じ特徴値のセットに対して異なる応答がある場合、クラスタリングを使用してこれをフィルタリング/分析できますか?)

0 投票する
0 に答える
227 参照

stata - MANOVA 仮定検定の Stata での mvtest のサンプル サイズ

特定の Stata コマンドに関するアドバイスを探しています。MANOVA (Stata 内) でシミュレーション出力を分析しており、仮定をテストしたいと考えています。具体的には、(1) 等分散性と (2) 従属変数の相関関係です。

テスト用に Stata で次のコードを使用していますが、以下のエラー メッセージが表示されます。

エラーメッセージ:

私の実験では、108 の処理グループと処理グループごとに 24 のサンプル (したがって 2.592 観測) の Box-Behnken 分数計画を使用しています。私の意見では、これで十分です。

私が間違っていることを誰かが知っていますか?

0 投票する
1 に答える
59 参照

machine-learning - このトレーニング データセットは、分類モデルのトレーニングとテストに十分ですか?

私のトレーニング データセットには、40 個の特徴を持つ 2 つのクラスしか含まれていません。

ケース 1 では、クラス 1 には 35 個のサンプルがあり、クラス 2 には 700 個のサンプルがあります。

ケース 2 では、クラス 1 には 65 個のサンプルがあり、クラス 2 には上記と同じ値があります。

SVM 分類子またはその他の分類子を使用してモデルを構築するには、トレーニング データセットで十分ですか?

WEKAを使用しています。テスト オプションは10 倍の交差検証%66で、非常に良い結果が得られます。