1

次の形式のデータがあります。

TxnId    Items
    1        a
    1        b
    1        c
    2        r 
    2        t

ここで、「TxnId」と「Items」は列です。ファイルを R にインポートし、次のコマンドを実行しました。

df_fact <- data.frame(lapply(MyData,as.factor))
df_trans <- as(df_fact, 'transactions')

apriori コマンドを実行すると、エラーがスローされます。

rules = apriori(df_trans, parameter=list(supp=0.95, conf=0.95, target=”rules”))
inspect(rules)
#NULL
inspect(rules[1:5])
Error in inspect(rules[1:5]) : 
  error in evaluating the argument 'x' in selecting a method for function 'inspect': Error in slot(x, s)[i] : subscript out of bounds

また、R がデータを受け入れる形式を教えてください。

4

2 に答える 2

0

私は、強制 (たとえば、'as(dataname, "transactions"..) など) で多くの問題を抱えてきました。

これは、重複したレコード (つまり、データが「単一」形式の場合、同じトランザクションで同じ商品を複数回購入したこと) があるためだと思います。

これが最終的に私のために働いたものです:

Transactions<- read.transactions("Data with tx ids, item names, in
                      single format.csv", 
                      rm.duplicates= TRUE, sep=",",
                      format = "single", cols = c(7,9));

(7 列目に tx ID、9 列目にアイテム名)

于 2015-10-19T20:31:39.247 に答える