3

dplyr bootstrap関数を適切に使用する方法を理解するのに問題があります。

私が望むのは、ランダムに割り当てられた 2 つのグループからブートストラップ分布を生成し、平均の差を計算することです。たとえば、次のようになります。

library(dplyr) 
library(broom) 
data(mtcars) 

mtcars %>% 
  mutate(treat = sample(c(0, 1), 32, replace = T)) %>% 
  group_by(treat) %>%
  summarise(m = mean(disp)) %>% 
  summarise(m = m[treat == 1] - m[treat == 0])

問題は、この操作100を 、1000、またはそれ以上繰り返す必要があることです。

を使用してreplicate、私はできる

frep = function(mtcars) mtcars %>% 
  mutate(treat = sample(c(0, 1), 32, replace = T)) %>% 
  group_by(treat) %>%
  summarise(m = mean(disp)) %>% 
  summarise(m = m[treat == 1] - m[treat == 0])

replicate(1000, frep(mtcars = mtcars), simplify = T) %>% unlist()

そして分布を得る

ここに画像の説明を入力

ここの使い方がよくわかりませんbootstrap。どのように始めればよいですか?

mtcars %>% 
  bootstrap(10) %>% 
  mutate(treat = sample(c(0, 1), 32, replace = T)) 

mtcars %>% 
  bootstrap(10) %>% 
  do(tidy(treat = sample(c(0, 1), 32, replace = T))) 

それは本当に機能していません。bootstrapピップはどこに置くべきですか?

ありがとう。

4

1 に答える 1