以下は、x の要素を n 個のグループに分割するすべての可能な組み合わせを作成する関数です (すべてのグループは同じ数の要素を持ちます)。


perm.groups <- function(x,n){
    nx <- length(x)
    ning <- nx/n

    group1 <- 
    ng <- ncol(group1)

    if(n > 2){
      out <- vector('list',ng)

      for(i in seq_len(ng)){
        other <- perm.groups(setdiff(x,group1[,i]),n=n-1)
        out[[i]] <- lapply(seq_along(other),
                       function(j) cbind(group1[,i],other[[j]])
    out <- unlist(out,recursive=FALSE)
    } else {
      other <- lapply(seq_len(ng),function(i) 
      out <- lapply(seq_len(ng),
                    function(i) cbind(group1[,i],other[[i]])

擬似コード (説明)

nb = number of groups
ning = number of elements in every group
if(nb == 2)
   1. take first element, and add it to every possible 
       combination of ning-1 elements of x[-1] 
   2. make the difference for each group defined in step 1 and x 
       to get the related second group
   3. combine the groups from step 2 with the related groups from step 1

if(nb > 2)
   1. take first element, and add it to every possible 
       combination of ning-1 elements of x[-1] 
   2. to define the other groups belonging to the first groups obtained like this, 
       apply the algorithm on the other elements of x, but for nb-1 groups
   3. combine all possible other groups from step 2 
       with the related first groups from step 1

この関数 (および疑似コード) は、Joris Meys によってこの以前の投稿で最初に作成されました: Find all possible ways to split a list of elements into aa given number of group of group of the same size

指定された数のランダムに可能な組み合わせを返す関数を作成する方法はありますか? このような関数は、関数が返すランダムな異なる組み合わせの数を修正する、percentage.possibilities または number.possiblities のいずれかである 3 番目の引数を取ります。




@JackManey の提案に取り組んで、1 つの順列グループを等確率でサンプリングできます。

sample.perm.group <- function(ning, ngrp)
    if( ngrp==1 ) return(seq_len(ning))

    g1 <- 1+sample(ning*ngrp-1, size=ning-1)

    g1 <- c(1, g1[order(g1)])

    remaining <- seq_len(ning*ngrp)[-g1]

    cbind(g1, matrix(remaining[sample.perm.group(ning, ngrp-1)], nrow=ning), deparse.level=0)

ここningで、 はグループあたりの要素数で、ngrpはグループ数です。


> ind <- sample.perm.group(3,3)
> ind
     [,1] [,2] [,3]
[1,]    1    2    5
[2,]    3    7    6
[3,]    4    8    9
> LETTERS[1:9][ind]
[1] "A" "C" "D" "B" "G" "H" "E" "F" "I"

サイズ N の順列のサンプルを生成するには、次の 2 つのオプションがあります。繰り返しを許可する場合、つまり置換を伴うサンプルの場合、前の関数を N 回実行するだけで済みます。OTOH、サンプルを交換せずに採取する場合は、拒否メカニズムを使用できます。

sample.perm.groups <- function(ning, ngrp, N)
    result <- list(sample.perm.group(ning, ngrp))

    for( i in seq_len(N-1) )
            y <- sample.perm.group(ning, ngrp)

            if( all(vapply(result, function(x)any(x!=y), logical(1))) ) break

        result[[i+1]] <- y


これは明らかに等確率サンプリング設計であり、可能な組み合わせの数は通常 N よりもはるかに多いため、効率が悪いとは考えられません。

