apriori - Apriori のアルゴリズムをデータマイニング用に最適化する方法はありますか?

翻译自：https://stackoverflow.com/questions/4004414 2010-10-23T14:18:04.973

1404 次

1

私はいくつかのデータをマイニングしています。時間を節約したい。では、何か方法はありますか？

2 に答える 2

1

正しいプログラミング言語の使用 (例: VB の使用は悲惨な結果になる可能性があります)
必要な情報を定式化し、それに応じてプログラムをコーディングします
データベースのサイズを縮小するか、必要に応じてデータベースを準備します
スーパーコンピューター (はい、ハードウェアは重要です。冗談はさておき、非常に大きなデータセットには優れたコンピューター esp が必要です)
Apriori アルゴリズム自体を次のように改善します。

• ハッシュベースのアイテムセットカウント: 対応するハッシュバケットカウントがしきい値を下回る k-アイテムセットは、頻繁に発生することはできません。
•トランザクション削減: 頻繁な k-itemset を含まないトランザクションは、後続のスキャンでは役に立ちません。
•パーティショニング: DB で頻繁に使用される可能性のある項目セットは、DB の少なくとも 1 つのパーティションで頻繁に使用する必要があります。
•サンプリング: 与えられたデータのサブセットのマイニング、サポートしきい値の低下 + 完全性を判断する方法。
• 動的アイテムセットのカウント: すべてのサブセットが頻繁であると推定される場合にのみ、新しい候補アイテムセットを追加します。

于 2010-12-03T18:13:54.790 に答える