特定のカテゴリを可能なすべてのグループ化の組み合わせに分割するダミー変数を生成する方法を探しています。たとえば、3 つのカテゴリ (A、B、C など) がある場合、考えられるグループは 5 つあります。
Three groups: A / B / C
Two groups: A&B / C
Two groups: A&C / B
Two groups: A / B&C
One group: A&B&C
次に、各グループのダミー変数がデータ フレームの異なる列に出力されます。したがって、必要な最終出力は次の表のようになります。
sample_num category grouping1 grouping2 grouping3 grouping4 grouping5
A; B; C A&B; C A&C; B A; B&C A&B&C
-----------+---------+------------+-----------+-----------+-----------+----------
1 A 1 1 1 1 1
2 A 1 1 1 1 1
3 A 1 1 1 1 1
4 A 1 1 1 1 1
5 B 2 1 2 2 1
6 B 2 1 2 2 1
7 B 2 1 2 2 1
8 C 3 2 1 2 1
9 C 3 2 1 2 1
10 C 3 2 1 2 1
11 C 3 2 1 2 1
12 C 3 2 1 2 1