6

非常に大きなデータ セット (~50 000) に対してboot()とのboot.ci()関数を使用したいと思います。library("boot")type="bca"

R(ブートストラップの数) が小さすぎる場合、次のエラーが発生します。

Error in bca.ci(boot.out, conf, index[1L], L = L, t = t.o, t0 = t0.o,  : 
  estimated adjustment 'a' is NA

大きすぎるのも嫌です。

R の適切な数は? データのサイズに依存することはわかっています。

4

1 に答える 1

11

一般に、信頼区間では、推定よりも多くのブートストラップが必要です。過去 10 年間で計算能力が向上したため、推定値に 1000 のブートストラップ、信頼区間に 10000 という提案を聞いたことがあります。

現在、boot()関数には複数のコアでブートストラップを実行できる引数parallelがあります。計算時間が問題になる場合は、これを使用して、サイズのデータ​​セットの分析を実行するのにかかる時間を大幅に短縮することができます。

于 2012-08-05T12:19:02.657 に答える