6

最小サポートと最小信頼度がマイニング アソシエーション ルールで自動的に決定されるかどうかを知りたいですか? もしそうなら、リソースへのヒントやポインタは素晴らしいでしょう.

4

1 に答える 1

8

はい、minsup と minconf のしきい値を自動的に決定する方法がいくつかあります。

しかし、最初に、minsup および minconf パラメーターの選択方法について少し説明させてください。それらの選択は、データによって異なります。

最低限のサポートとして、一部のデータでは 80% を使用しています。他のデータについては、0.05 % を使用します。それはすべてデータセットに依存します。通常、高い値から始めて、十分なパターンを生成する値が見つかるまで値を減らします。

分のために。信頼、ルールで必要な信頼を表すため、少し簡単です。通常、私は 60% のようなものを使用します。なぜなら、実際に 60% 未満のルールには興味がないからです。しかし、それはデータにも依存します。

パフォーマンスに関しては、minsup が高いほどパターンが少なくなり、アルゴリズムが高速になります。minconf の場合、それを高く設定すると、パターンは少なくなりますが、多くのアルゴリズムが minconf を使用して検索スペースを削減しないため、高速ではない可能性があります。したがって、これらのパラメーターの設定は、必要なルールの数にも依存します。

minsup パラメータを使用したくない場合は、上位 k アソシエーション ルール マイニング アルゴリズムを使用できます。この場合、たとえば k=1000 を指定すると、アルゴリズムは、与えられた最小信頼度で最も頻繁に使用される 1000 個のルールを検出します。アソシエーション ルール マイニング用に、TopKRulesという名前のそのようなアルゴリズムを設計しました。SPMF オープンソース データ マイニング ライブラリからソース コードをダウンロードできます。SPMFは、アソシエーション ルールとパターン マイニング アルゴリズムの多くの実装を提供します。

minsup しきい値を自動的に設定する別の解決策は、数学関数を使用して、データ量に基づいて設定することです。その方法の例として、私のブログ投稿をここで見ることができます。

minsup と minconf を設定するための解決策を見つけようとしている他の研究もあります。それらは Google Scholar で見つけることができます。

于 2014-08-30T17:02:09.517 に答える