r - arules での 1 ステップ対 2 ステップの関連付けルールマイニング - なぜ違うのですか?

Question

私の理解では、Apriori アルゴリズムは、最初にサポートのしきい値を満たすすべての頻度の高いアイテムセットを見つけてから、最小の信頼度も満たす頻度の高いアイテムセットから強力な関連付けルールを生成することによって機能します。

したがって、R パッケージのルールでは次のようになると予想されます。

txs <- as(inputDataTable,"transactions") itemsets <- apriori(txs, parameter = list(support = 0.05, confidence = 0.7, target="frequent itemsets")) rules <- ruleInduction(itemsets)

と

txs <- as(inputDataTable,"transactions") rules <- apriori(txs, parameter = list(support = 0.05, confidence = 0.7, target="rules"))

は同じルールになりますが、2 番目の例ではより多くのルールが見つかり、その理由がわかりません。

これがなぜなのか説明できる人はいますか？私は今しばらくそれについて頭を悩ませようとしています..

score 0 · Accepted Answer

わかりました..かなり簡単です。これで、何が問題だったのかがわかります。

同様の問題に遭遇した人のために。問題は、すべてのアイテムセットを見つけるときではなく、(もちろん) ruleInduction() ステップで信頼度を設定する必要があることでした。その場合、サポートのみが関連します。ruleInduction() ステップで信頼度の値を指定しなかったため、信頼度のデフォルト値である 0.8 が使用され、検出されるルールが少なくなりました。

そうやって：

txs <- as(inputDataTable,"transactions") itemsets <- apriori(txs, parameter = list(support = 0.05, target="frequent itemsets")) rules <- ruleInduction(itemsets, confidence = 0.7)

と

txs <- as(inputDataTable,"transactions") rules <- apriori(txs, parameter = list(support = 0.05, confidence = 0.7, target="rules"))

同じ結果につながります。:)

r - arules での 1 ステップ対 2 ステップの関連付けルール マイニング - なぜ違うのですか?

1 に答える 1

Related

Reference

r - arules での 1 ステップ対 2 ステップの関連付けルールマイニング - なぜ違うのですか?