問題タブ [mlxtend]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 大規模なトランザクション データセットの Python でのマーケット バスケット分析
apriori (サポート >= 0.01) および python の mlxtend パッケージを使用して association_rules 関数を 4.2L+ 行のトランザクション データ (スパース マトリックスの形式) に適用すると、頻出アイテム セットと関連付けルールの生成に時間がかかりすぎます。
サンプル トランザクション スパース マトリックス (pandas DataFrame)、MBA の入力データ:
a) MBA を適用する前に、トランザクション データのスパース マトリックスの表現を最適化する方法はありますか?
b) トランザクションデータの代替の効率的な表現はありますか?