dplyr
bootstrap
関数を適切に使用する方法を理解するのに問題があります。
私が望むのは、ランダムに割り当てられた 2 つのグループからブートストラップ分布を生成し、平均の差を計算することです。たとえば、次のようになります。
library(dplyr)
library(broom)
data(mtcars)
mtcars %>%
mutate(treat = sample(c(0, 1), 32, replace = T)) %>%
group_by(treat) %>%
summarise(m = mean(disp)) %>%
summarise(m = m[treat == 1] - m[treat == 0])
問題は、この操作100
を 、1000
、またはそれ以上繰り返す必要があることです。
を使用してreplicate
、私はできる
frep = function(mtcars) mtcars %>%
mutate(treat = sample(c(0, 1), 32, replace = T)) %>%
group_by(treat) %>%
summarise(m = mean(disp)) %>%
summarise(m = m[treat == 1] - m[treat == 0])
replicate(1000, frep(mtcars = mtcars), simplify = T) %>% unlist()
そして分布を得る
ここの使い方がよくわかりませんbootstrap
。どのように始めればよいですか?
mtcars %>%
bootstrap(10) %>%
mutate(treat = sample(c(0, 1), 32, replace = T))
mtcars %>%
bootstrap(10) %>%
do(tidy(treat = sample(c(0, 1), 32, replace = T)))
それは本当に機能していません。bootstrap
ピップはどこに置くべきですか?
ありがとう。