データセット「大人」を使用しています。 http://archive.ics.uci.edu/ml/datasets/Adult apriori を使用して頻繁にルールを取得し、リフトで並べ替えました。
library(arules)
trans = read.transactions("adult.data", format = "basket", sep = ",", rm.duplicates = TRUE)
rules <- apriori(trans)
rules.lift <- sort(rules, decreasing = TRUE, by="lift")
実行すると
inspect(head(rules.lift,100))
以下を取得します。
lhs rhs support confidence lift
1 { 13,
Male,
United-States} => { Bachelors} 0.1024507 0.9976077 6.066125
2 { 0,
13,
Male,
United-States} => { Bachelors} 0.1024507 0.9976077 6.066125
等
たとえば、ルールでは次のようになります。
{ 0,
13,
Male,
United-States} => { Bachelors}
それとそれがどの属性であるかをどのように知ることができ0
ます13
か? データセットの説明とデータ自体を見たので、それ13
は教育番号で0
あり、資本損失であると思いますが、2つ以上の属性が同じ範囲を持つ場合があるため、それらを区別する方法がわかりません.
>class(rules.lift)
[1] "rules"
attr(,"package")
[1] "arules"
私はここで読みました:ルールで生成されたアイテムの列名/属性をどのように知ることができますか?問題はデータを前処理していないことです。それで、どうすればそれを行うことができますか?
どうもありがとうございました!