次の問題を処理するためのpythonicな方法を探しています。
このpandas.get_dummies()
方法は、データフレームのカテゴリ列からダミーを作成するのに最適です。たとえば、列に の値がある場合、 は 2 つのダミー変数を作成し['A', 'B']
、get_dummies()
それに応じて 0 または 1 を割り当てます。
今、私はこの状況を処理する必要があります。単一の列、それを「ラベル」と呼びましょう。値は次のようになり['A', 'B', 'C', 'D', 'A*C', 'C*D']
ます。get_dummies()
は 6 つのダミーを作成しますが、行に複数の 1 が含まれるように、4 つだけが必要です。
これをpythonicな方法で処理する方法はありますか? それを取得するための段階的なアルゴリズムしか考えられませんでしたが、それには get_dummies() は含まれません。ありがとう
編集され、より明確になることを願っています!