3

背景頻繁にアイテムセットをマイニングする例のほとんどは、固有のアイテムとのトランザクションを持っています。たとえば{1,2}, {1,3}, {2,3,5,6}, {6}。トランザクションの重複が結果に影響するかどうか知りたいです。例えば{1,2,1}, {2,2,3}, {4,3}, {4,1,2,4,2,6}

質問アプリオリ アルゴリズムを使用すると、トランザクション データベースでの 1 アイテムのサポートは何になります{1,2,1}, {2,2,3}, {4,3}, {4,1,2,4,2,6}か? 結果は次のようになると思います。

{1}: 2
{2}: 3
{3}: 2
{4}: 2
{6}: 1
4

3 に答える 3

1

「デフォルト」の FIM アルゴリズムは重複を許可しません。

ただし、重複を追加のアイテムとして簡単にエンコードできます。つまり、

{ Beer, Beer }  ->  { Beer, Beer_2 }

その後は通常通りに進みます。次に、次のような退屈な関連付けルールが表示されます。

{ Beer_2 } -> { Beer }

つまり、2 番目のビールを購入した人は、最初のビールも購入しました。

ただし、これらは結果から削除するのは簡単です:が左側にある場合などx、右側に移動することを考慮しないでください。x_2

于 2014-01-10T09:27:44.353 に答える