問題タブ [market-basket-analysis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python-3.x - Python での関連分析 - groupby でのメモリ エラー
「マーケットバスケット」のような問題で関連分析を行っています(一緒に販売されている製品を見つけます)。私は、150Mb のデータ、約 7mi のレジスタ (請求書と製品などのデータ) を含む 12 か月のデータセットを持っています。Hadoop に行く価値はないと思います。このチュートリアル ( http://pbpython.com/market-basket-analysis.html ) に従っていますが、df.unstack() でメモリ エラーが発生します。部。
また、改善できる点があれば教えてください。よろしくお願いします。
r - Rの項目値のルール置換
だから、私は自分のデータでルールを機能させようとしています.transaction_ID、Item_name、Item_IDがあります。しかし、item_name と transaction_ID に対して apriori 関数を呼び出すと遅すぎますが、item_id と transaction_ID で呼び出すと非常に高速です。では、item_id を使用してルールを作成し、ID を実際の名前に置き換える方法はありますか? 使用するコード例を次に示します。