問題タブ [sample-size]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
295 参照

r - R の samplesize パッケージ、パラメーターの理解

小さな免責事項:これを相互検証に投稿することを検討しましたが、これはソフトウェアの実装に関連していると思います。同意しない場合は、質問を移行できます。

パッケージsamplesizeを試しています。k関数のパラメーターが何であるかを解読しようとしていますn.ttest。ドキュメントには次のように記載されています。

k サンプル分数 k

これはあまり役に立ちません。このパラメータは正確には何ですか?

私は次の計算を実行しています。すべての重要な値はvals変数に含まれており、以下に提供します。

vals次の値が含まれます。

kオブザベーションの総数における 1 つのグループの割合は? それとも別のものですか?私が正しければ、比率は または のグループに対応しますsd1sd2?

0 投票する
2 に答える
35 参照

testing - 1000 ドキュメントのセットが均一かどうかの簡単な統計テスト

統計に関する簡単な質問があります。ここにいる誰かがすぐに答えてくれることを願っています。

200 個のドキュメントのセットがあり、各ドキュメントには正確に 3 ページが含まれている必要があります。私の仮定では、これらの文書は 100% 全部で 3 ページあると思います。そのセットが均質であること、つまりすべてのドキュメントが正確に 3 ページであることを統計的に確認するサンプルを取得したいと考えています。サンプルで != 3 ページのドキュメントが 1 つでも見つかった場合、セットが不均一であることがわかります。

セットが均一であることを 80% 確信するには、いくつのドキュメントを確認する必要がありますか? 基本セットに 200 を超えるドキュメント (たとえば 1000) を含める必要がありますか?

0 投票する
0 に答える
287 参照

r - R の PROC POWER SAMPLEFREQ に相当

Rで検出力計算(同等性検定:両側二項比率)をしたいのですが、SASで同様のコードを見つけました(参考までに以下に表示)。

同様の計算のためにRでサンプルコードを提供することで誰かが私を助けることができますか?

0 投票する
1 に答える
1143 参照

r - グローバル最小値の最適化

次の関数の n の最小値を見つけるために使用しようとしてoptimize()います (Clopper-Pearson 下限):

そして、これが私がそれを最適化しようとした方法です:

値がその範囲内にあると思われるため、間隔 [300,400] でこれを行いましたが、最終的には 0 と無限大の間で最適化を行いたいと考えています。間隔に関係なく、その間隔の下限を最小値として生成するため、このコマンドは局所的な最小値を生成しているようです-これはclopper-pearsonから疑われるものではありません。それで、私の2つの質問は、Rでグローバル最小値を適切に見つける方法と、任意の間隔でそうする方法ですか?

0 投票する
1 に答える
260 参照

r - サンプル サイズの power.prop.test 関数の光沢のあるレンダリング出力

私は光沢にかなり慣れていないので、質問がかなり単純であることは知っていますが、多くの調査を行ったにもかかわらず、比例テストの出力をレンダリングするために光沢を得ることができないようです. ユーザーがすべてのパラメーター (p1、p2、sig.level、power) を入力し、サンプル サイズ n が与えられるスクリプトを作成しようとしています。私はさまざまな方法を試しましたが、通常は出力がないか、「'n'、'p1'、'p2'、'power'、および 'sig.level' のいずれかが NULL でなければなりません」というエラーになります。 . どんな助けでも大歓迎です、ありがとう!

これまでの私のコード:

0 投票する
0 に答える
29 参照

sampling - 臨床試験でサンプルサイズを決定するための参考文献が必要

私はいくつかの臨床試験研究に取り組んでいます。したがって、さまざまな種類の臨床研究でサンプルサイズを決定するための記事が必要です. 私はすでにそれをグーグルで調べました。この分野の専門家が私に非常に役立ついくつかの記事を提案できる場合。

0 投票する
1 に答える
508 参照

r - longpower パッケージの pct.change パラメータの意味は?

ねえ、私は縦断研究のために検出力計算を実行しようとしています。私は longpower パッケージを使用してきました。nlme モデルのサンプル サイズを計算しようとしたときに、lmmpower コマンドの pct.change パラメーターの背後にある意味について少し混乱しました。たとえば、次のコマンドの .3 は何を表しているのでしょうか。

パッケージの説明には、「関心のあるパラメーターのパイロット推定値の変化率(ベータ、プラセボ/ヌル効果)」と記載されていますが、理解に苦しんでいます. 誰かが簡単な例で説明できれば、本当に感謝しています。また、これがここに属しているのか、相互検証されているのか不明なので、そうでない場合は申し訳ありません.

0 投票する
2 に答える
692 参照

python - Named Entity Recognition ゴールド スタンダード コーパスのサンプル サイズ

私は 170 のオランダ文学小説のコーパスを持っており、これに固有表現認識を適用します。オランダ語の既存の NER タガーを評価するために、このコーパスのランダム サンプルで名前付きエンティティに手動で注釈を付けたいと思います。この目的のためにbratを使用します。手動で注釈を付けたランダム サンプルは、NER タガーの評価における「ゴールド スタンダード」として機能します。文レベルでコーパスのランダム サンプルを出力する Python スクリプトを作成しました。

私の質問は、小説あたりの文の量に関して、ランダムサンプルの理想的なサイズはどれくらいですか? 今のところ、小説ごとにランダムな 100 文を使用しましたが、これにより、ほぼ 21626 行を含むかなり大きなランダム サンプルが生成されます (手動で注釈を付けるには多くの量が必要であり、ガキの作業環境が遅くなります)。