python - 大規模なトランザクションデータセットの Python でのマーケットバスケット分析

翻译自：https://stackoverflow.com/questions/53077133 2018-10-31T05:55:59.660

6316 次

apriori (サポート >= 0.01) および python の mlxtend パッケージを使用して association_rules 関数を 4.2L+ 行のトランザクションデータ (スパースマトリックスの形式) に適用すると、頻出アイテムセットと関連付けルールの生成に時間がかかりすぎます。

サンプルトランザクションスパースマトリックス (pandas DataFrame)、MBA の入力データ:

Invoice no./ Products  Shirt  T-shirt  Jeans  Footwear
                    1      1        1      0         0
                    2      0        0      1         0
                    3      0        1      0         1

a) MBA を適用する前に、トランザクションデータのスパースマトリックスの表現を最適化する方法はありますか?

b) トランザクションデータの代替の効率的な表現はありますか?

python - 大規模なトランザクション データセットの Python でのマーケット バスケット分析

2 に答える 2

Related

Reference

python - 大規模なトランザクションデータセットの Python でのマーケットバスケット分析