1

私はいくつかのデータをマイニングしています。時間を節約したい。では、何か方法はありますか?

4

2 に答える 2

1
  1. 正しいプログラミング言語の使用 (例: VB の使用は悲惨な結果になる可能性があります)

  2. 必要な情報を定式化し、それに応じてプログラムをコーディングします

  3. データベースのサイズを縮小するか、必要に応じてデータベースを準備します

  4. スーパーコンピューター (はい、ハードウェアは重要です。冗談はさておき、非常に大きなデータセットには優れたコンピューター esp が必要です)

  5. Apriori アルゴリズム自体を次のように改善します。

    • ハッシュベースのアイテムセット カウント: 対応するハッシュ バケット カウントがしきい値を下回る k-アイテムセットは、頻繁に発生することはできません。
    •トランザクション削減: 頻繁な k-itemset を含まないトランザクションは、後続のスキャンでは役に立ちません。
    •パーティショニング: DB で頻繁に使用される可能性のある項目セットは、DB の少なくとも 1 つのパーティションで頻繁に使用する必要があります。
    •サンプリング: 与えられたデータのサブセットのマイニング、サポートしきい値の低下 + 完全性を判断する方法。
    • 動的アイテムセットのカウント: すべてのサブセットが頻繁であると推定される場合にのみ、新しい候補アイテムセットを追加します。

于 2010-12-03T18:13:54.790 に答える