次の形式のエッジリストがあります。
Product_B Consumer_Id_1
Product_B Consumer_Id_2
Product_A Consumer_Id_3
これを scikit Learn の項目ベースのフィルタリングに使用したいのですが、これをスパース scipy マトリックスに変換する必要があります。各行または列は、消費者が購入したかどうかにかかわらず、タイトルの特徴ベクトルを 1 または 0 で表します。そのタイトル。
scipy に関するドキュメントは、奇妙にわかりにくいものです。numpy または pandas で配列を明示的にピボットせずにスパース行列を構築するにはどうすればよいですか?
前もって感謝します!