0

アイテムセットの適切な最小サポートと信頼性について、あらゆる種類の資料を提案してください!

::i アプリオリ アルゴリズムを使用して、頻度の高い項目セットを検索します。アイテムセットの適切なサポートと信頼性がまだわかりません。サポートの大きさを決定するためにどのような考慮事項があるか知りたいです。

4

3 に答える 3

3

答えは、適切な値はデータに依存するということです。

一部のデータセットでは、最適な値は 0.5 です。しかし、他のいくつかのデータセットでは、0.05 かもしれません。それはデータに依存します。

ただし、minsup = 0 および minconf = 0 に設定すると、一部のアルゴリズムが終了する前にメモリ不足になるか、パターンが多すぎてディスク容量が不足する可能性があります。

私の経験から、minsup と minconf を選択する最良の方法は、高い値から始めて、十分なパターンが見つかるまで徐々に値を下げることです。

または、minsup を設定する必要がない場合は、minsup を指定する代わりに、たとえば k 個の最も頻繁なルールが必要であることを指定する top-k アルゴリズムを使用できます。たとえば、k = 1000 ルールです。

トップ k アソシエーション ルール マイニングに興味がある場合は、ここで私の Java コードを確認できます。

http://www.philippe-fournier-viger.com/spmf/

このアルゴリズムは TopKRules と呼ばれ、それを説明する記事は来月公開される予定です。

それに加えて、サポートと信頼度以外にも多くの興味深い尺度があることを知っておく必要があります。リフト、全信頼度などです。これについて詳しく知るには、次の記事を参照してください。「アソシエーション ルールの興味深い尺度の選択について」 「連想ルールのおもしろさ対策調査」 基本的にどの対策にも問題がある場合があり、万全の対策はありません。

お役に立てれば!

于 2012-04-25T23:19:22.460 に答える
0

最小サポートおよび最小信頼パラメーターは、ユーザーの好みです。より多くの結果(統計的信頼性が低い)が必要な場合は、パラメーターを適切に選択してください。理論的には、これらを0に設定できます。アルゴリズムは実行されますが、時間がかかり、結果はほとんど何でも含まれているため、特に有用ではありません。

したがって、結果がニーズに合うようにそれらを選択してください。数学的には、どの値も「正しい」です。

于 2012-03-14T17:13:07.110 に答える
0

Apriori を含む任意のアソシエーション ルール マイニング アルゴリズムでは、提供するサポート値と信頼値を決定するのはユーザー次第です。データセットと目的に応じて、minSup と minConf を決定します。明らかに、これらの値を低く設定すると、アルゴリズムの実行に時間がかかり、多くの結果が得られます。

于 2012-03-14T11:15:10.227 に答える