n
一連の要素を 0 個以上のr
要素グループと残りの要素に分割するすべての可能な方法を生成するアルゴリズムおよび/または Python コードを探しています。たとえば、次のセットがあるとします。
[1,2,3,4,5]
とn = 5
でr = 2
、取得したい
((1,2,3,4,5),)
((1,2),(3,4,5))
((1,3),(2,4,5))
...
((1,2),(3,4),(5,))
((1,2),(3,5),(4,))
...
つまり、セットから 2 つのアイテムのグループを 0 個抽出した結果、セットから 2 つのアイテムのグループを 1 つ抽出した結果、およびセットから 2 つのアイテムのグループを 2 つ抽出した結果、...n
が大きい場合、これは続くでしょう。
これらの結果が生成される順序は重要ではなく、個々のグループ内の要素の順序も、結果内のグループの順序も重要ではありません。(例:とと などと((1,3),(2,4,5))
同等です。) 私が求めているのは、すべての個別の結果が、可能な限り効率的な方法で少なくとも 1 回、できれば正確に 1 回生成されることです。((3,1),(4,5,2))
((2,5,4),(1,3))
力ずくの方法はr
、n
要素から可能なすべての組み合わせを生成し、それらの組み合わせの任意の数 ( powerset ) のすべての可能なグループを作成し、それらを反復処理して、グループ内の組み合わせに要素がないもののみを処理することです。一般。少数の要素でも時間がかかりすぎます (2^(n!/r!(nr)!) グループを反復処理する必要があるため、複雑さは二重指数関数的です)。
この質問で指定されたコードに基づいて、これは本質的にr = 2
andの特殊なケースでありn
、次のように思いつきました。
def distinct_combination_groups(iterable, r):
tpl = tuple(iterable)
yield (tpl,)
if len(tpl) > r:
for c in combinations(tpl, r):
for g in distinct_combination_groups(set(tpl) - set(c), r):
yield ((c,) + g)
これは考えられるすべての結果を生成するように見えますが、いくつかの重複が含まれていますn
。したがって、重複を回避するアルゴリズムを期待しています。