次のコードでは、ブートストラップを使用して、トマト植物に適用された 2 つの異なる肥料が植物の収量に影響を与えないという帰無仮説の下で CI と p 値を計算します (別の方法としては、「改良された」肥料の方が優れているということです)。最初のランダム サンプル (x) は、標準的な肥料が使用された植物からのもので、2 番目のサンプル (y) は植物で「改良された」肥料が使用されたものです。
x <- c(11.4,25.3,29.9,16.5,21.1)
y <- c(23.7,26.6,28.5,14.2,17.9,24.3)
total <- c(x,y)
library(boot)
diff <- function(x,i) mean(x[i[6:11]]) - mean(x[i[1:5]])
b <- boot(total, diff, R = 10000)
ci <- boot.ci(b)
p.value <- sum(b$t>=b$t0)/b$R
上記のコードで気に入らない点は、リサンプリングが 11 個の値のサンプルが 1 つしかないかのように行われることです (最初の 5 個をサンプル x に属するものとして分離し、残りをサンプル y に残します)。ブートストラップのリサンプリングが、元データ?