次のようなデータセットがあります (空白で各製品が区切られていることに注意してください)。
Client_ID Purchase
121212 "Orange_Juice Lettuce"
121212 "Banana Bread "
230102 "Banana Apple"
230102 "Chicken"
121212 "Chicken Bread"
301450 "Grapes Lettuce"
... ...
ここで、各アイテムのダミー変数を使用して、各人が購入する製品を知りたいと思います。
Client_ID Apple Banana Bread Chicken Grapes Lettuce Orange_Juice
121212 0 1 1 1 0 1 1
230102 1 1 0 1 0 0 0
301450 0 0 0 0 1 1 0
... ... ... ... ... ... ... ...
数週間前に同様の質問をしましたが、ここの場合のように、同じ行に複数の項目がありませんでした。だから私は本当に迷っています。アイテムを複数の列に分けようとしましたが、購入ごとにアイテムの数が異なる可能性があるため(私の知る限り、最大数十個)、理想的ではありませんでした。
続行する方法についてのアイデアはありますか?前もって感謝します!