私はデータ サイエンスを学んでおり、データセットのダミー変数を作成したいと考えています。
["Category1", "Category2".."CategoryN"] のような一致するカテゴリのリストである「製品カテゴリ」列を持つデータフレームがあります。
Pandas にはダミー変数を自動的に作成する便利な機能 (pandas.get_dummies) があることは知っていますが、この場合は使用できないのではないでしょうか (?)。
各行をループして、各列の一致する要素に 1 を追加する方法を知っています。私の現在のコードはこれです:
for column_name in df.columns[1:]: #first column is "Product Category" and appended dummy columns (product category names) to the right previously
for index, _ in enumerate(df[column_name][:10]): #limit 10 rows
if column_name in df["Product Category"][index]:
df[column_name][index] = 1
ただし、上記のコードは効率的ではなく、100,000 行を超えるため使用できません。どういうわけか配列全体で操作を行いたいのですが、その方法がわかりません。
誰か助けてくれませんか?