私はいくつかのデータをマイニングしています。時間を節約したい。では、何か方法はありますか?
質問する
1404 次
2 に答える
1
正しいプログラミング言語の使用 (例: VB の使用は悲惨な結果になる可能性があります)
必要な情報を定式化し、それに応じてプログラムをコーディングします
データベースのサイズを縮小するか、必要に応じてデータベースを準備します
スーパーコンピューター (はい、ハードウェアは重要です。冗談はさておき、非常に大きなデータセットには優れたコンピューター esp が必要です)
Apriori アルゴリズム自体を次のように改善します。
• ハッシュベースのアイテムセット カウント: 対応するハッシュ バケット カウントがしきい値を下回る k-アイテムセットは、頻繁に発生することはできません。
•トランザクション削減: 頻繁な k-itemset を含まないトランザクションは、後続のスキャンでは役に立ちません。
•パーティショニング: DB で頻繁に使用される可能性のある項目セットは、DB の少なくとも 1 つのパーティションで頻繁に使用する必要があります。
•サンプリング: 与えられたデータのサブセットのマイニング、サポートしきい値の低下 + 完全性を判断する方法。
• 動的アイテムセットのカウント: すべてのサブセットが頻繁であると推定される場合にのみ、新しい候補アイテムセットを追加します。
于 2010-12-03T18:13:54.790 に答える