mahout で fpgrowth を学んでいるのですが、頻度の高いアイテムセットの誕生の機能を見つけましたが、mahout を使用して頻度の高いアイテムセットでルールを形成するにはどうすればよいですか? mahoutにはまだ実装されていませんか?
2 に答える
頻繁なパターンからルールを計算することはかなり簡単であり、おそらく並列処理と分散の恩恵はあまりありません。結局のところ、データから取得する頻度の高いパターンの数ははるかに少ないと予想されます。
したがって、頻繁に使用するパターンの量によっては、Mahoutの外部でそれを行う方がはるかに高速な場合があります。
Mahout は、パターン マイニングに特化したものではありません。
SPMF ソフトウェアを確認できます: http://www.philippe-fournier-viger.com/spmf/index.php (私は著者です)。
頻出アイテムセットおよび関連ルール マイニングに関連する 45 を超えるアルゴリズムの Java ソース コードがあります。
FPGrowth などのいくつかの古典的なアルゴリズムのアルゴリズムが含まれています。しかし、希少なアイテムセット、消去可能なアイテムセット、有用性の高いアイテムセット、不確実なデータからのアイテムセットなどのマイニングなど、他のデータ マイニング ツールには見られないいくつかの特殊なアルゴリズムも提供します。
たとえば、「古典的な」関連付けルール以外にも、さまざまな種類の関連付けルールを試すことができます。たとえば、閉じた関連付けルール、関連付けルールの有益で一般的な基本、逐次ルールなどです。
GPL の下でライセンスされており、いくつかの最も一般的なアルゴリズムにはシンプルな GUI インターフェイスがあります。質問がある場合は、フォーラムに投稿してください。回答を試みます。