既存のサンプル データから、より大きなデータ サンプルを生成しようとしています。たとえば、4500 (種ごとに 1500) に再スケーリングしたいとしますiris
。N = 150
例は、https://seslezak.github.io/IrisData/の投稿で説明されています。たとえば、を使用して新しい値を生成したくない、resample
または生成することに興味があります。これが私が今まで試したことです。bootstrap
rnorm
muSepal.Length = mean(iris$Sepal.Length)
sdSepal.Length = sd(iris$Sepal.Length)
muSepal.Width= mean(iris$Sepal.Width)
sdSepal.Width = sd(iris$Sepal.Width)
N = 5000
simulated_data = data.frame(Sepal.Length = rnorm(N, muSepal.Length,sdSepal.Length),Sepal.Width =rnorm(N,muSepal.Width,sdSepal.Width))
ここでサンプル分布から値を取得しましたが、この「新しい」データセット全体を効率的に構築する方法を理解するのに苦労していますか?