可変数のビンにクラスター化された〜10 ^ 6値で構成されるデータセットに取り組んでいます。分析の過程で、クラスタリングをランダム化しようとしていますが、ビンのサイズは一定に保っています。おもちゃの例 (疑似コード) として、これは次のようになります。
data <- list(c(1,5,6,3), c(2,4,7,8), c(9), c(10,11,15), c(12,13,14));
sizes <- lapply(data, length);
for (rand in 1:no.of.randomizations) {
rand.data <- partition.sample(seq(1,15), partitions=sizes, replace=F)
}
だから、私は "partition.sample" のような関数を探しています。これはベクトル (seq(1,15) など) を取り、そこからランダムにサンプリングし、"サイズ」。
タスクはそれほど難しくないように思われるので、私はそのような関数を自分で作成しようとしています。ただし、ベクトルを特定のビンサイズに分割することは、「ボンネットの下」で行うと、はるかに高速かつ効率的になるように見えます。つまり、おそらくネイティブ R ではそうではありません。関数、または誰かが周りのスマートなソリューションを教えてくれるかどうか:-)
あなたの助けと時間は非常に高く評価されています! :-)
一番、
ライモンド
更新:
「ランダム化の回数」とは、「ランダム化ループ」全体を実際に実行した回数を意味します。これには、後で、実際のサンプリングだけでなく、より多くのステップが含まれることは明らかです。
さらに、上記の偉業を置き換えなしでサンプリングするためのトリックにも興味があります。
よろしくお願いします。