1

データセット「大人」を使用しています。 http://archive.ics.uci.edu/ml/datasets/Adult apriori を使用して頻繁にルールを取得し、リフトで並べ替えました。

library(arules)
trans = read.transactions("adult.data", format = "basket", sep = ",", rm.duplicates = TRUE)
rules <- apriori(trans)
rules.lift <- sort(rules, decreasing = TRUE, by="lift")

実行すると

  inspect(head(rules.lift,100))

以下を取得します。

    lhs                 rhs               support confidence     lift
  1   { 13,                                                            
      Male,                                                          
      United-States} => { Bachelors}    0.1024507  0.9976077 6.066125
  2   { 0,                                                             
       13,                                                            
       Male,                                                          
       United-States} => { Bachelors}    0.1024507  0.9976077 6.066125

たとえば、ルールでは次のようになります。

 { 0,                                                             
   13,                                                            
   Male,                                                          
   United-States} => { Bachelors}

それとそれがどの属性であるかをどのように知ることができ0ます13か? データセットの説明とデータ自体を見たので、それ13は教育番号で0あり、資本損失であると思いますが、2つ以上の属性が同じ範囲を持つ場合があるため、それらを区別する方法がわかりません.

>class(rules.lift)
[1] "rules"
attr(,"package")
[1] "arules"

私はここで読みました:ルールで生成されたアイテムの列名/属性をどのように知ることができますか?問題はデータを前処理していないことです。それで、どうすればそれを行うことができますか?

どうもありがとうございました!

4

0 に答える 0